OpenAI 幫 Claude Code 做了官方 Plugin:用 Codex 審查 Claude 寫的 Code
⚠️ 注意
此文發布於 2026-04-01,需留意是否為愚人節玩笑。部分指令(如 /plugin marketplace)在 Claude Code 中尚未有公開文件確認,請自行驗證。
核心概念
OpenAI 幫 Anthropic 的 Claude Code 做了一個官方 plugin,裝入後可以直接叫 GPT (Codex) 來審查你在 Claude 上的工作。
為什麼要讓另一個 AI 來審?
用 Claude 寫了一段 code,然後叫 Claude 自己檢查——它當然覺得自己寫得很好,那是它的邏輯、它的假設。這跟你寫完報告自己校對一樣,有錯就是看不到。
研究數據
有研究讓 5 個 AI 模型互相審查同一段 code:
- Bug 偵測率:單一模型 53% → 多模型互審 80%
- 最難抓的系統級 bug:偵測率直接 100%
Claude vs GPT 定位
GPT 5.4 在大部分 coding benchmark 上贏 Opus,便宜 6 倍。但不是全面更強——擅長的東西剛好補上 Claude 的弱點。
Reddit 500+ 開發者共識:
- Claude:品質更好,但限速太快
- Codex:邏輯分析更強
- 最佳工作流 = Claude 做架構,Codex 做審查
真實案例
案例一:遊戲 Bug
用 Claude Code 寫遊戲,跑起來沒問題。叫 Codex 做 adversarial review 後抓出兩個致命 bug:
- 一個會讓玩家永久卡關
- 一個會丟失存檔資料
Claude 自己 review 過,完全沒發現。
案例二:Race Condition
用 Codex 審查 caching 設計,找出一個 race condition:並發寫入時觸發。
安裝方式(待驗證)
/plugin marketplace add openai/codex-plugin-cc
/plugin install codex@openai-codex
裝好後三個指令:
/codex:review— 標準審查/codex:adversarial-review— 對抗式審查,專挑設計漏洞/codex:rescue— 整個任務丟給 Codex
核心觀點
2026 年用 AI 寫 code,不是選最強的那個,是讓它們互相挑錯。