Matt Pocock 的 skills repo:AI Coding 缺的不是更多角色,而是工程紀律

Threads 這篇的核心判斷很準:AI coding 現在缺的不是更多「角色扮演」式 agent,而是一套能阻止 AI 亂來的工程紀律。

作者先批評幾套常見 workflow / skill:GSD 慢、問很多但 bug 仍多;SuperPower 在大 feature 上有價值,但小任務反而變阻礙;gstack 把 CEO reviewer、engineering manager、designer、QA lead、release engineer、debugger 等角色全塞進來,看似完整,但「角色變多,不等於判斷變好」。這個批評其實打到目前很多 agent workflow 的痛點:它們把流程複雜化,卻沒有改善回饋迴路與工程判斷。

真正值得注意的是 Matt Pocock 的 mattpocock/skills。官方 README 的定位很直接:Skills For Real Engineers,並明確說這是他每天用來做真實工程的 agent skills,不是 vibe coding。它不是要由框架接管整個流程,而是提供小型、可調整、可組合、任何模型都能用的 skills。

這套 repo 目前包含 22 個 SKILL.md,重點集中在幾個工程失敗模式:

  1. 需求不清楚:先 grill,不准直接寫 code

README 把最常見 failure mode 定義為 misalignment:你以為 agent 懂了,結果做出來完全不是你要的。對應技能是 /grill-me 與 /grill-with-docs,要求 agent 在動手前先追問需求、釐清變更目的,甚至建立共享語言與 ADR。

  1. 名詞混亂:建立 shared language,不要讓 agent 每次重新猜

Matt Pocock 強調 ubiquitous language。當專案裡的 domain language 沒有被文件化,agent 會用 20 個字描述一個其實應該有名字的概念,後續也容易命名混亂、上下文浪費。/grill-with-docs 會協助建立 CONTEXT.md,把難以解釋的決策與專案術語沉澱下來。

  1. Bug 出現:先建立 reproduction loop,不准靠猜

repo 裡的 /diagnose 把 bug 修復拆成可驗證流程:先重現、定位、建立回饋迴路,再修。這比「請幫我修 bug」有效,因為它限制 agent 不准憑直覺亂改。

  1. 加功能:拆 vertical slice,不是只拆 DB / API / UI

好的 agent workflow 不只是拆任務,而是拆成能交付、能驗證、能逐步合併的 vertical slice。否則 AI 很容易先做一堆底層抽象,最後才發現產品行為不對。

  1. 測試:測 behavior,不測 implementation detail

repo 內有 /tdd。這點和 Threads 作者的判斷一致:AI coding 的核心不是產生更多 code,而是每次改動都能用 behavior 驗證。沒有 behavior-level tests,agent 就會把「看似完成」當成完成。

我的判斷:這篇對 BigIntTech / Hermes 的價值在於提醒我們,skills 不是拿來堆 buzzword 的。真正有效的 skill 應該是「限制 agent 犯錯」的工程護欄,而不是「讓 agent 看起來更忙」的劇場。

我會把它拆成三個可落地原則:

  • domain language 要清楚:專案術語、業務規則、重要決策要沉澱在 CONTEXT.md / CLAUDE.md / skill 裡。
  • feedback loop 要真實:bug 要有 reproduction loop;功能要有驗收方式;測試要驗 behavior。
  • workflow 要小而可組合:不要為了顯得完整而塞十幾個角色;每個 skill 都要能解決明確 failure mode。

這也解釋了為什麼很多「AI 團隊模擬」看起來很強,實際上很容易變成自動化技術債。因為它們增加的是流程表面積,不是判斷品質。

可參考的官方資訊:

  • GitHub repo:mattpocock/skills
  • 快速安裝:npx skills@latest add mattpocock/skills
  • 官方定位:small, easy to adapt, composable, works with any model
  • 核心技能包含:grill-me、grill-with-docs、diagnose、tdd、to-prd、to-issues、triage、improve-codebase-architecture、zoom-out、setup-pre-commit 等

原始來源: https://www.threads.com/@techtalk.ai.tech.web/post/DX76J7_DV4f

延伸來源: https://github.com/mattpocock/skills

Matt Pocock 的 skills repo:AI Coding 缺的不是更多角色,而是工程紀律 | Allen 知識庫 | Allen 知識庫