Microsoft Webwright:Web Agent 的產物應該是可重跑的 Playwright 程式
Web Agent / SWE-style browser automation
Webwright 把瀏覽器代理的核心輸出改成「可重跑程式」
Threads 的判斷很準:web agent 正在分成兩派,一派把瀏覽器 session 當狀態,另一派把 terminal / workspace 當狀態。Microsoft Webwright 站在後者,讓模型寫 Python Playwright script,並用 screenshots、logs、traces 與 script artifact 完成可審計自動化。
官方定位
GitHub README 稱 Webwright 是 SWE-style browser agent framework,讓 coding models 成為 browser agents,要求每個 web task 以可重跑 Python script 端到端完成。
關鍵差異
傳統 browser agent 的價值常留在當下 session;Webwright 讓價值沉澱成 workspace 裡的程式、截圖、log、trace。
工程意義
可重跑 artifact 讓任務能 review、修改、測試、納入 CI,也能在網站小改版時局部修 script,而不是重跑整個黑盒 agent。
| 模式 | 一次性 browser agent | Webwright 式 artifact |
|---|---|---|
| 狀態 | 瀏覽器 DOM / session | terminal + workspace |
| 輸出 | 點擊結果或最終答案 | Python Playwright script、截圖、log、trace |
| 審計 | 難以重現 | 可讀、可重跑、可 diff |
| 維護 | 下次再讓 agent 點一次 | 修改 script / selector / assertion |
實務 caveat:可重跑不代表永遠穩定。Web automation 仍會遇到登入、CAPTCHA、A/B test、動態 selector、反機器人策略與服務條款限制。Webwright 的亮點是把這些問題暴露成工程 artifact,而不是藏在 agent 黑盒裡。
Sources
Threads: https://www.threads.com/@vincent.chanw/post/DY162mkmvz2
GitHub: https://github.com/microsoft/Webwright
Project page: https://microsoft.github.io/Webwright
Threads: https://www.threads.com/@vincent.chanw/post/DY162mkmvz2
GitHub: https://github.com/microsoft/Webwright
Project page: https://microsoft.github.io/Webwright