Vibe Coding 拉高地板,Agentic Engineering 才守得住天花板

這篇 Threads 摘的是 Andrej Karpathy 在 Sequoia AI Ascent 訪談「From Vibe Coding to Agentic Engineering」裡的一個關鍵區分:Vibe Coding 讓所有人更容易寫出軟體,但 Agentic Engineering 才是專業工程師接下來真正要掌握的能力。

Karpathy 的說法很精準:Vibe Coding 是 raising the floor,拉高所有人的能力地板;Agentic Engineering 是 preserving the quality bar,守住專業軟體原本該有的品質門檻。前者讓更多人可以快速做出東西,後者則回答一個更嚴肅的問題:當 AI agent 變得很強但仍然不穩定時,人類要如何協調它們,在加速開發的同時不引入安全漏洞、不犧牲架構品質?

Vibe Coding 的典型狀態是:你用自然語言描述需求,AI 產出一大段程式碼,你越來越信任它,甚至想不起上次手動修 AI 程式碼是什麼時候。這對 side project、prototype、內部工具非常有價值,因為它把「能不能做出來」的門檻大幅降低。

但 Karpathy 也指出,這種完全放飛的程式碼常有問題:臃腫、重複、抽象脆弱、看起來能跑但不漂亮,甚至藏著安全漏洞。這也是為什麼 Vibe Coding 不等於專業軟體工程。它可以讓你更快抵達 demo,但不保證你能安全地抵達 production。

Agentic Engineering 的核心,是把 AI agent 當成一群很強但像實習生的執行者。它們記憶力好、速度快、可以重構大量程式碼,也能在可驗證領域表現極強;但它們會犯很奇怪的錯,而且常常不知道自己錯在哪裡。人類的角色不再是親手打完每一行程式,而是設計規格、建立護欄、審查結果、維持系統整體一致性。

訪談中 Karpathy 舉了一個很好的例子:他的 app 裡,使用者用 Google 帳號登入、用 Stripe 購買 credits。AI agent 曾試圖用 email address 去對應 Google 與 Stripe 帳號,結果如果兩邊 email 不同,錢就可能掛錯人。這不是語法錯誤,而是產品與資料模型層級的錯。這類錯誤正是 Agentic Engineer 必須守住的地方:唯一使用者 ID、金流歸屬、安全邊界、資料一致性,不能交給 agent 自由發揮。

這背後還有一個更大的概念:Jagged Intelligence,鋸齒狀智力。Karpathy 說,當任務高度可驗證,例如數學、程式碼、測試、漏洞掃描,模型能力會飆升;但遇到缺乏明確獎勵訊號的情境,它可能又顯得很笨。他用一個例子說明:最先進模型可以重構十萬行程式碼、找零日漏洞,卻可能在「洗車場離我 50 公尺,我應該走路還是開車去洗車?」這種問題上答錯。

所以 Agentic Engineering 不是盲目信任 AI,而是理解 AI 在哪些 circuit 裡飛得很快、在哪些地方會掉下來。你要把任務拆成可驗證的形式,建立測試、lint、型別檢查、安全掃描、code review、E2E、自動攻擊測試,讓 agent 的輸出可以被系統性檢查。

這也會改變工程師招聘。Karpathy 認為,傳統解題面試越來越像舊範式;更合理的測試是給候選人一個大型專案,例如做一個 Twitter clone,要求它好用、安全、可部署,然後用多個 AI agent 去攻擊它,看候選人如何設計、修補、協調與防守。也就是說,工程能力會從「單點解題」轉向「系統建造與 agent orchestration」。

Threads 留言裡有一個焦慮也很真實:「如果我能叫 AI 幫我理解,那我自己到底還有什麼用?」原作者回覆的方向是掌握全局、不看細節,專攻一兩個專業,其餘讓 AI 協助。我認為這個答案可以再補強:人類的價值不是比 AI 記得更多 API,而是能判斷什麼值得做、怎麼定義正確、哪裡不能出錯,以及最後是否接受這個結果。

對 BigIntTech 的實務啟發:我們不該把 AI coding workflow 停在「叫模型寫 code」。真正要建立的是 Agentic Engineering pipeline:

  • 先寫清楚 spec / acceptance criteria,而不是直接丟一句「幫我做」。
  • 讓 agent 實作,但要求它同步產出測試、遷移、文件與風險說明。
  • 用另一個 agent 或 reviewer 專門攻擊:安全、資料權限、金流邏輯、錯誤處理、競態條件。
  • 所有可驗證項目都自動化:unit test、E2E、typecheck、lint、migration check、API contract check。
  • 對不可完全驗證的部分,人類保留最後判斷:產品取捨、使用者體驗、商業優先級、架構方向。

我的判斷:Vibe Coding 是新的基本功,但不能停在爽感。真正會拉開差距的是誰能把 AI agent 納入工程紀律,把「很會 prompt」升級成「很會設計可驗證系統」。未來的高手不是不用 AI 的工程師,也不是完全把腦袋外包給 AI 的人,而是能把 AI 當團隊管理的人。

Karpathy 那句話值得留下來:「你可以外包你的思考,但你不能外包你的理解。」更準確地說,計算、搜尋、語法與樣板可以外包;但理解、責任、判斷與品味仍然要留在人身上。

來源:

Vibe Coding 拉高地板,Agentic Engineering 才守得住天花板 | Allen 知識庫 | Allen 知識庫