阿里巴巴 PageAgent 深度评测:改变网页自动化的页面内嵌式 GUI Agent
阿里巴巴 PageAgent 深度评测:改变网页自动化的页面内嵌式 GUI Agent
今天我们来深入分析阿里巴巴开源的 page-agent—一款发布后即获得 8,600+ GitHub Star 的 JavaScript 页面内嵌 GUI Agent。它不仅仅是一个浏览器自动化工具,更是用自然语言控制网页界面的全新范式。
它有什么特别之处?
PageAgent 通过简单的 <script> 标签将 AI Agent 直接嵌入到任何网页中。与 Playwright、Puppeteer 等从外部控制浏览器实例的工具不同,pageAgent 运行在用户的浏览器会话中—它看到用户看到的 DOM,用用户已有的权限执行操作。
六维质量评估
评估维度得分权重核心亮点
结构完整性9.015%7个包的TypeScript monorepo,文档完善,Demo/Chrome扩展/MCP全配齐
指令清晰度8.