文章

Chrome系列4:ScriptCat支持AI助手能力(第一版 MVP)

零、随听分享

知行合一,在机器学习时代:言 = 0%,行 = 100%。

一、Why Need ScriptCat Support AI ?

  1. 公司内部分享过Tampermonkey提效,反响较好,能够周维度提效4H以上,还是在没有全链路梳理的情况。

  2. 日常自己对Chrome Script开发也有需求,但是开发需要跨多个程序调试,效率较低,不够vibe coding。

  3. Tab支持Script Skill,看起来不错,但是效果不够好。

二、相关链接

  1. ScriptCat官方仓库:https://github.com/scriptscat/scriptcat

  2. boommanpro fork 支持 ai:https://github.com/boommanpro/scriptcat

三、期望实现效果

在宿主网页(比如百度页面),支持唤起AI对话,可以选择元素,生成脚本,当前网站可以直接运行。

四、实际效果

Snipaste_2026-02-02_20-37-02.jpg
Snipaste_2026-02-02_20-36-56.jpg

五、实现总结

  1. 原本是通过内嵌iframe的形式实现,但是存在源代码交错处理,以及iframe处理域不同的问题,维护成本较高。

    1. 最终采用sider panel api,效果不错,赞。

  2. 宿主页面和sider panel的交互问题,需要借助message通信,需要在宿主页面运行js方便通信执行,这是原本没有考虑到的,因为chrome本身有很多安全机制,为了绕过,有很多巧妙设计,但是换个角度,也学习到了很多攻防手段。

  3. 元素选择 实现,当前是vibe coding的绿色版本,比较丑,后续打算和chrome devtools一致,保证一致性。

  4. 刷新能力:原本没有,但是发现llm返回经常出错,有时候把页面直接干没了,还是需要刷新功能的。

  5. 页面跟随能力,引为是sider panel,所以脚本其实仅适配当前页面,不应该随着变动,所以需要跟随,但是换个角度,是不是应该动态关闭呢?

六、收获

  1. 刚开始实现的时候其实就是单纯的想选择 + 对话,做着做着发现还是不够爽,在解决问题之间还是存在一些gap,换个角度,是不是在vibe coding的今天,更应该想清楚?

  2. 工程角度:大模型的上下文窗口虽然在不断变大,但是对于应用本身,多少可能都不够,agent工程本身设计也至关重要。

  3. 还是要想清楚要什么,全链路闭环更重要。