Vibe Coding 拉高地板，Agentic Engineering 才守得住天花板

這篇 Threads 摘的是 Andrej Karpathy 在 Sequoia AI Ascent 訪談「From Vibe Coding to Agentic Engineering」裡的一個關鍵區分：Vibe Coding 讓所有人更容易寫出軟體，但 Agentic Engineering 才是專業工程師接下來真正要掌握的能力。

Karpathy 的說法很精準：Vibe Coding 是 raising the floor，拉高所有人的能力地板；Agentic Engineering 是 preserving the quality bar，守住專業軟體原本該有的品質門檻。前者讓更多人可以快速做出東西，後者則回答一個更嚴肅的問題：當 AI agent 變得很強但仍然不穩定時，人類要如何協調它們，在加速開發的同時不引入安全漏洞、不犧牲架構品質？

Vibe Coding 的典型狀態是：你用自然語言描述需求，AI 產出一大段程式碼，你越來越信任它，甚至想不起上次手動修 AI 程式碼是什麼時候。這對 side project、prototype、內部工具非常有價值，因為它把「能不能做出來」的門檻大幅降低。

但 Karpathy 也指出，這種完全放飛的程式碼常有問題：臃腫、重複、抽象脆弱、看起來能跑但不漂亮，甚至藏著安全漏洞。這也是為什麼 Vibe Coding 不等於專業軟體工程。它可以讓你更快抵達 demo，但不保證你能安全地抵達 production。

Agentic Engineering 的核心，是把 AI agent 當成一群很強但像實習生的執行者。它們記憶力好、速度快、可以重構大量程式碼，也能在可驗證領域表現極強；但它們會犯很奇怪的錯，而且常常不知道自己錯在哪裡。人類的角色不再是親手打完每一行程式，而是設計規格、建立護欄、審查結果、維持系統整體一致性。

訪談中 Karpathy 舉了一個很好的例子：他的 app 裡，使用者用 Google 帳號登入、用 Stripe 購買 credits。AI agent 曾試圖用 email address 去對應 Google 與 Stripe 帳號，結果如果兩邊 email 不同，錢就可能掛錯人。這不是語法錯誤，而是產品與資料模型層級的錯。這類錯誤正是 Agentic Engineer 必須守住的地方：唯一使用者 ID、金流歸屬、安全邊界、資料一致性，不能交給 agent 自由發揮。

這背後還有一個更大的概念：Jagged Intelligence，鋸齒狀智力。Karpathy 說，當任務高度可驗證，例如數學、程式碼、測試、漏洞掃描，模型能力會飆升；但遇到缺乏明確獎勵訊號的情境，它可能又顯得很笨。他用一個例子說明：最先進模型可以重構十萬行程式碼、找零日漏洞，卻可能在「洗車場離我 50 公尺，我應該走路還是開車去洗車？」這種問題上答錯。

所以 Agentic Engineering 不是盲目信任 AI，而是理解 AI 在哪些 circuit 裡飛得很快、在哪些地方會掉下來。你要把任務拆成可驗證的形式，建立測試、lint、型別檢查、安全掃描、code review、E2E、自動攻擊測試，讓 agent 的輸出可以被系統性檢查。

這也會改變工程師招聘。Karpathy 認為，傳統解題面試越來越像舊範式；更合理的測試是給候選人一個大型專案，例如做一個 Twitter clone，要求它好用、安全、可部署，然後用多個 AI agent 去攻擊它，看候選人如何設計、修補、協調與防守。也就是說，工程能力會從「單點解題」轉向「系統建造與 agent orchestration」。

Threads 留言裡有一個焦慮也很真實：「如果我能叫 AI 幫我理解，那我自己到底還有什麼用？」原作者回覆的方向是掌握全局、不看細節，專攻一兩個專業，其餘讓 AI 協助。我認為這個答案可以再補強：人類的價值不是比 AI 記得更多 API，而是能判斷什麼值得做、怎麼定義正確、哪裡不能出錯，以及最後是否接受這個結果。

對 BigIntTech 的實務啟發：我們不該把 AI coding workflow 停在「叫模型寫 code」。真正要建立的是 Agentic Engineering pipeline：

先寫清楚 spec / acceptance criteria，而不是直接丟一句「幫我做」。
讓 agent 實作，但要求它同步產出測試、遷移、文件與風險說明。
用另一個 agent 或 reviewer 專門攻擊：安全、資料權限、金流邏輯、錯誤處理、競態條件。
所有可驗證項目都自動化：unit test、E2E、typecheck、lint、migration check、API contract check。
對不可完全驗證的部分，人類保留最後判斷：產品取捨、使用者體驗、商業優先級、架構方向。

我的判斷：Vibe Coding 是新的基本功，但不能停在爽感。真正會拉開差距的是誰能把 AI agent 納入工程紀律，把「很會 prompt」升級成「很會設計可驗證系統」。未來的高手不是不用 AI 的工程師，也不是完全把腦袋外包給 AI 的人，而是能把 AI 當團隊管理的人。

Karpathy 那句話值得留下來：「你可以外包你的思考，但你不能外包你的理解。」更準確地說，計算、搜尋、語法與樣板可以外包；但理解、責任、判斷與品味仍然要留在人身上。

來源：

Threads：https://www.threads.com/@iamraven.tw/post/DXwM9rgkuXF?xmt=AQF0DsODoZBQbcV3bIRUI0YoQ5p8A_1Lz4yFqULDvGEaeDbN9B5dKeiFS_eGwEB9-4aV-GA&slof=1
YouTube：https://www.youtube.com/watch?v=96jN2OCOfLs
影片標題：Andrej Karpathy: From Vibe Coding to Agentic Engineering