Chrome系列4:ScriptCat支持AI助手能力(第一版 MVP)
零、随听分享
知行合一,在机器学习时代:言 = 0%,行 = 100%。
一、Why Need ScriptCat Support AI ?
公司内部分享过Tampermonkey提效,反响较好,能够周维度提效4H以上,还是在没有全链路梳理的情况。
日常自己对Chrome Script开发也有需求,但是开发需要跨多个程序调试,效率较低,不够vibe coding。
Tab支持Script Skill,看起来不错,但是效果不够好。
二、相关链接
ScriptCat官方仓库:https://github.com/scriptscat/scriptcat
boommanpro fork 支持 ai:https://github.com/boommanpro/scriptcat
三、期望实现效果
在宿主网页(比如百度页面),支持唤起AI对话,可以选择元素,生成脚本,当前网站可以直接运行。
四、实际效果


五、实现总结
原本是通过内嵌iframe的形式实现,但是存在源代码交错处理,以及iframe处理域不同的问题,维护成本较高。
最终采用sider panel api,效果不错,赞。
宿主页面和sider panel的交互问题,需要借助message通信,需要在宿主页面运行js方便通信执行,这是原本没有考虑到的,因为chrome本身有很多安全机制,为了绕过,有很多巧妙设计,但是换个角度,也学习到了很多攻防手段。
元素选择 实现,当前是vibe coding的绿色版本,比较丑,后续打算和chrome devtools一致,保证一致性。
刷新能力:原本没有,但是发现llm返回经常出错,有时候把页面直接干没了,还是需要刷新功能的。
页面跟随能力,引为是sider panel,所以脚本其实仅适配当前页面,不应该随着变动,所以需要跟随,但是换个角度,是不是应该动态关闭呢?
六、收获
刚开始实现的时候其实就是单纯的想选择 + 对话,做着做着发现还是不够爽,在解决问题之间还是存在一些gap,换个角度,是不是在vibe coding的今天,更应该想清楚?
工程角度:大模型的上下文窗口虽然在不断变大,但是对于应用本身,多少可能都不够,agent工程本身设计也至关重要。
还是要想清楚要什么,全链路闭环更重要。