Vibe Coding 已死?還是 Agentic Engineering 起飛?——或許是 AI 工具的兩條產品線

Vibe Coding vs Agentic Engineering

上個月底,Karpathy 在 Sequoia 的 AI Ascent 2026 做了一場訪談。三週不到,網路上冒出幾十篇文章在討論這場對話。

有趣的是——講的明明是同一場訪談,結論卻長得完全不一樣。

一邊說:「Agentic Engineering 讓頂尖開發者的生產力遠超 10x!這是軟體開發的未來!」

另一邊,一位在藥廠 Takeda 帶團隊的 VP 丟出了一個數字:AI 輔助的開發團隊,PR review 時間反而增加了 91%。

(咦!?10x 和 91%…這兩個數字放在一起,怎麼看都不像在講同一件事吧…)

到底是 10x 加速,還是 91% 減速?

這讓我很好奇——大家到底是怎麼讀這場訪談的。


主流報導做了什麼

我翻了十幾篇相關文章。

幾乎清一色在做同一件事:把 Karpathy 的框架,用自己的話重新說一遍。Floor vs Ceiling、Jagged Intelligence、Software 3.0——這些概念被搬來搬去,標題越聳動越好。「Vibe Coding Is Dead(Vibe Coding 已死)」、「Welcome to Agentic Engineering(歡迎來到 Agentic Engineering 時代)」,諸如此類。

但幾乎沒有人多問一句:他舉的那些例子,場景是什麼?主詞是誰?

大師講了,照單全收,包裝轉發。

我意思是——這不就是用 Vibe Coding 的方式在消費 Agentic Engineering 的概念嗎?接受了輸出,沒有理解內容。

(好吧,也許這就是內容產業的 Vibe Writing…XD)


回到訪談本身:主詞一直是「我」

帶著這個疑問,我重新看了一遍訪談的逐字稿。這次不看結論,只看場景。

Karpathy 在訪談中舉的例子:

MenuGen——「去餐廳看不懂菜單,所以做了一個拍照就能看到菜品圖片的工具。」後來他發現,用 Gemini 一句提示詞就能把圖片直接渲染到菜單照片上,根本不需要那個 app。他的結論是:我那個 app 不該存在。

OpenClaw 安裝——不再是 shell script,而是「一段文字,貼給我的 agent,它會自己判斷環境然後裝好。」

LLM 知識庫——「讀了一篇文章,想整理成我的 wiki。」

Side projects 資料夾——「我的資料夾塞滿各種隨機的東西。」

未來願景——「我的 agent 跟你的 agent 談,來處理會議細節。」

整場三十分鐘,全部都是第一人稱。沒有出現過團隊協作、組織流程、跨部門權責、程式碼的長期維運。

不是他在迴避這些議題。是那本來就不是他在談的事。

Karpathy 從一年前提出 Vibe Coding,到現在講 Agentic Engineering,一直在做同一件事:描述一個人怎麼用 AI 做自己想做的東西。只是成熟度升級了——從「能做出來」到「做出來要有品質」。他定義的 Vibe Coding 是「raising the floor(提升地板)」,讓所有人都能動手。Agentic Engineering 是「preserving the quality bar(維持品質標準)」,讓你在用 agent 加速的同時不犧牲專業水準。

Floor 到 Ceiling 的距離,講的是同一個人身上的能力差距。不是不同角色之間的協作。


那 91% 是怎麼回事

那個數字來自 Takeda 藥廠的 VP David Feldman,寫在 SD Times 上。

他看到的場景跟 Karpathy 完全不一樣——不是一個人做 side project,而是一個有好幾組開發者的企業團隊。

在組織裡,寫程式的人和審程式的人不是同一個人。Agent 介入之後,寫的速度確實快了。但審查者面對的問題變了——以前的 PR review 是在看「這段 code 對不對」,現在變成「寫這段的人到底有沒有理解他在建什麼」。

他用了一句很有穿透力的話來描述這個狀況:AI 生成的程式碼讀起來很有自信——結構乾淨、命名一致、註解完整。它看起來不像是一個不確定的人寫的,即使底層邏輯裡藏著一個「賭這件事永遠不會發生」的假設。

認知負擔不是消失了,是轉移了。而且變重了——因為審查者現在要做的不只是檢查品質,還要重建開發者可能跳過的思考過程。

Karpathy 的世界裡不存在這個角色。因為他的所有例子裡,寫的人和審的人是同一個人。一個人做 side project,交接成本為零。自己寫、自己判斷、自己承擔,品味和判斷力只要自己有就夠了。

但在組織場景裡,這個前提不成立。


兩條不同的路

到這裡,矛盾其實消失了。

因為 10x 和 91% 講的根本不是同一件事。它們來自兩個不同的場景,適用於兩條不同的產品發展路線。

個人端:更強的個人 Agent

Agent 越來越強、軟體作為中介層逐漸消失。最終每個人都有一個通用智能代理——你有需求,它幫你生成解決方案,用完就結束了,下次有新需求就再生一個。

Karpathy 的 Software 3.0、「MenuGen 不該存在」、neural net 變主機 CPU 變協處理器——都在描述這條線。他說的「你可以外包你的思考,但你沒辦法外包你的理解(you can outsource your thinking but you can’t outsource your understanding)」也是對個人說的。

這條線上,他的預測很可能是對的。

企業端:能嵌入組織流程的 AI 協作架構

Agent 作為工具被整合進既有的組織流程、權責結構、合規要求裡。重要的不是個人品味,而是交接成本、審查機制、版本控制、長期維運。

這條線需要的不是「一個人的 agent 有多強」,而是「agent 產出的東西怎麼被團隊裡的其他人理解、審查、接手、維護」。PR review 時間增加 91%,正是這條線上的真實摩擦。

兩條線的成功定義不一樣,需要的能力不一樣,評價標準也不一樣。

主流報導的問題,就是把第一條線的結論直接貼到第二條線上。Karpathy 講的是個人開發者的天空,媒體卻拿來當整個軟體產業的天氣預報。


場景不同,結論就不同

所以,Karpathy 沒有講錯。是他的聽眾聽成了自己想聽的版本。

如果你是個人開發者、maker、想把自己的想法快速做出來的人——跟著他的方向走,大概不會有問題。更強的 agent、更少的中介層、更直接的「想法→成品」路徑,這條線的未來確實很令人期待。

但如果你在組織裡做決策,帶著團隊、扛著責任、面對的是客戶資料和合規要求——你需要的可能是另一條路。一條關注的不是個人生產力倍增,而是組織裡的認知負擔怎麼分配、品質標準怎麼在多人協作中維持的路。

這條路目前還沒有被好好命名。

(不過話說回來,如果哪天有人幫它取了一個很潮的名字,大概三週內又會有幾十篇文章冒出來,然後又各聽各的了吧…XD)

下次看到「大師說」的文章,也許可以多問一句:他說的那個場景,跟你的場景一樣嗎?


本文部分觀點源自與 AI 的對話討論,經整理後以個人觀點發布。

參考資料: