Codex Record & Replay:示範一次,讓 AI 把 SOP 變成可重播技能
過去要靠長提示詞逐條描述 SOP;Record & Replay 改成「示範式學習」:人類照平常做一次,Codex 生成可重用技能。
流程要重複、步驟穩定、成功標準清楚,且偏好或細節比文字說明更容易用操作展示。
重播時可結合 Computer Use、瀏覽器操作與已安裝插件,讓技能真正接手跨工具流程。
requirements.toml 管理 Codex,[features].computer_use 也會控制 Record & Replay 是否可用。
這項功能真正解決什麼問題
Codex Record & Replay 的價值不是「錄下滑鼠點擊」,而是把人類工作中最難寫清楚的隱性規則變成技能:欄位命名、檔案結構、預設值、最後驗收方式、哪些情況要跳過或補做。對團隊來說,這等於把個人的操作手感與 SOP 從「只能口耳相傳」升級成「可複製、可審查、可改善」的 AI 工作流程。
BusinessNext 以 YouTube 影片上架為例:團隊原本要從內部試算表取標題與描述,找到影片檔、縮圖、英文字幕,再進 YouTube Studio 填欄位、上傳素材、設為私人並檢查設定。Codex 看過一次後,下一次只要提供新影片檔案包,就能依據技能找出對應資料、填入內容、附上縮圖與字幕,並照既定流程驗證結果。
| 階段 | 人類做什麼 | Codex 學到什麼 |
|---|---|---|
| 錄製前 | 說明目標與會變動的輸入 | 這個技能的使用情境與輸入變數 |
| 錄製中 | 在 Mac 上完成一次真實流程 | 操作順序、視窗內容、工具切換、欄位填法 |
| 錄製後 | 停止錄製並要求 refinement | 技能草稿、驗證方式、隱性偏好 |
| 重播時 | 在新 thread 給新檔案、日期或任務值 | 用技能作為可重用上下文,自動執行並檢查 |
官方操作流程
- 在 Codex app 開啟 Plugins。
- 打開 + 選單,選擇 Record a skill。
- 閱讀建議提示,補充背景、目標與會變動的輸入。
- 當 Codex 要求錄製權限時,準備好再批准。
- 在 Mac 上完整示範工作流程。
- 流程完成後,從 menu bar、overlay,或直接告訴 Codex 停止錄製。
- 讓 Codex 產生技能,必要時要求它補上命名規則、預設值、決策點與驗證標準。
重播時,開一個新 thread,要求 Codex 使用剛建立的技能,並提供本次不同的值,例如要上傳的檔案、要建立的 issue、報告日期範圍或會議資訊。Codex 會把技能當作任務上下文,再依目前環境可用工具執行。
適合封裝成 Record & Replay skill 的流程
YouTube 影片上架、文章發布、素材打包、縮圖與字幕套用、公開/私人狀態檢查。
建立格式正確的 issue、整理 pull request、套用團隊 review 模板、下載固定報表。
費用申報、訂停車位、行事曆邀請、週期性後台操作、跨 SaaS 表單填寫。
錄製品質的五個關鍵
- 短而完整:示範越聚焦,技能越不容易把雜訊當規則。
- 先講變數:錄製前告訴 Codex 目標,以及未來每次會變動的輸入。
- 用真實但不敏感的資料:讓流程接近實務,但避免密碼、token、客戶個資或財務敏感資訊。
- 錄完後補隱性偏好:例如命名規則、欄位預設值、特殊情況判斷、驗證步驟。
- 完成就停止:不要把無關清理、閒逛或臨時查資料錄進同一個技能。
對 Allen / Hermes 工作流的啟發
這個方向和 Hermes skill / cron / browser automation 很接近:真正有價值的不是把每次操作都變成提示詞,而是把「重複出現的流程」提升成可維護的程序記憶。對 Allen 的日常工作,最值得優先封裝的會是:
讀原文、找官方來源、查重、寫 HTML-rich 文章、POST API、API + 前台雙重驗證。
固定來源下載、欄位對帳、分類、填入 Google Sheet、標記來源與驗證結果。
從 issue/MR/CI 狀態整理決策摘要,依照既定格式推進下一步。
重點是每個技能都要有清楚邊界:何時觸發、需要哪些輸入、不能碰哪些敏感資料、成功驗證是什麼。這也是從「AI 幫忙做事」走向「AI 接手固定營運流程」的分水嶺。