AI 時代的安慰獎——當每個人都拿到看起來不錯的結果 – DOFI 的情報術士團：文藝復興 2.0 的時代探索

從一隻貓開始想

上一篇文章《貓、煉金爐與統計重力》裡，我讓 Gemini 和 ChatGPT 分別去讀我的部落格文章，然後生成作者形象照。結果兩邊都畫了貓。

追問之後發現，這不是什麼深層的文字氣質分析——一個是面對「可愛圖案 T 恤」這個開放指令時的第一直覺，另一個是修正掉錯誤元素之後退回的預設值。路徑不同，終點一樣。我把這個現象叫做「語意空白處的統計重力」：當你沒有明確指定的時候，生成式 AI 會被訓練資料的高頻分佈拉向那個「最安全、最不出錯」的選項。

寫完那篇之後，我一直在想一件事——

如果圖像生成會在語意空白處滑向預設值，那文字呢？程式碼呢？是不是所有生成式 AI 的輸出，都在同一股重力的作用下？

文字和程式碼裡的 10點10分

在上一篇裡，我們已經看過統計重力在圖像生成領域的各種展現——從貓，到永遠停在 10點10分的手錶指針，到怎麼調都改不過來的美女身材標準（有興趣的可以去看：《貓、煉金爐、與統計重力》）。

但那些畢竟都是圖片。真正讓我開始擔心的，是文字和程式碼。

你有沒有注意過，叫不同的 AI 寫一篇「AI 趨勢觀察」，出來的文章結構幾乎一模一樣？

開頭一定是「AI 正在改變我們的世界」，中間列舉三到五個應用場景，穿插一段「機會與挑戰並存」，結尾收在「讓我們擁抱 AI 的未來」。

這就是文字領域的 10點10分指針。不是因為這個結構最好，而是因為網路上數以百萬計的科技文章就長這樣。模型讀了這些文章之後，學到了「寫 AI 趨勢，結構就該這樣排」這個高頻模式。

程式碼也一樣。你請 AI 寫一個登入頁面，十個開發者在十個不同的專案裡下了類似的提示詞，拿回來的程式碼結構會高度相似——同樣的框架選擇、同樣的元件拆法、同樣的命名慣例。不是因為那是「最佳實踐」，而是因為那是 GitHub 上 star 最多的 repo、Stack Overflow 上票數最高的答案所呈現的樣子。

訓練資料裡的最大公約數，就是生成輸出的預設目的地。

而這些輸出，看起來都「還不錯」。文章讀起來通順，程式碼能跑，圖片好看。沒什麼大毛病，交出去不會被罵。

但如果每個人拿到的「還不錯」都差不多——那這個「還不錯」還有什麼意義？

安慰獎效應

小時候參加比賽，沒得名次，但離場前工作人員遞給你一個小獎狀或紀念品。那一刻你是開心的——「我也有獎！」——直到你回頭看見，每個人手上都有一份一樣的。

那個從「我得獎了」到「喔，每個人都有」的落差感，就是目前生成式 AI 正在大規模製造的東西。

你下了一個提示詞，AI 在幾秒鐘內給了你一篇完整的文章、一段能跑的程式碼、一張精緻的圖片。你覺得「我完成了」，甚至覺得「這比我自己弄的好多了」。但問題是，隔壁那個人下了差不多的提示詞，也拿到了差不多的東西。再隔壁那個人也是。

每個人都拿到了自己的安慰獎，每個人都很滿意。

但沒有人得到真正屬於自己的東西。

你分辨不出來的，就是你的天花板

安慰獎最巧妙的地方在於：它不會讓你感覺到自己被安慰了。

一個有十年文字經驗的人，看到 AI 生成的文章，會直覺感覺到「結構太順了、轉折太安全了、開頭跟結尾都是套路」。他不一定能說出精確的原因，但他知道「差了一口氣」。所以他會介入——改掉那個太安全的開頭、刪掉那段其實沒必要的過渡、在某個地方插入一個只有他的經驗才會想到的比喻。

一個有十年開發經驗的工程師，看到 AI 生成的程式碼，會聞到「這裡的架構選擇太教科書了」。他知道這個案例有特殊的情境條件，教科書的解法雖然對，但三個月後會變成維護的噩夢。所以他會改——不是改語法，是改判斷。

但一個剛接觸這個領域的人呢？

他看到 AI 的輸出，覺得「不錯啊，比我自己寫得好」——這個判斷可能是對的。但他沒有參照系去分辨那個「不錯」到底是七十分還是九十分。他不知道那是 10:10 的指針，因為他沒看過夠多真正的手錶。他不知道那個程式架構三個月後會爆炸，因為他還沒經歷過那種爆炸。

所以他接受了。發表了。部署了。交付了。

而且他完全不覺得有什麼問題。

AI 是一面放大鏡，但它放大的是你已經有的東西——包括你的盲區。

你在某個領域有判斷力，AI 會讓你飛。你在某個領域沒有判斷力，AI 會讓你很有效率地量產安慰獎，而且全程感覺良好。

正在收緊的迴圈

如果事情只停在「個人拿到安慰獎」，那充其量是個人的問題。但真正讓我開始停下思考的，是接下來這一步。

那些被接受的安慰獎——那些「看起來還不錯」的文章、程式碼、圖片——被發表在網路上，進入了公開的資料庫。而這些資料，會成為下一代模型的訓練來源。

統計重力因此變得更強。盆地變得更深。

原本訓練資料裡「AI 趨勢文章就該這樣寫」的模式，因為越來越多 AI 生成的同結構文章被發表，佔比越來越高。下一代模型看到的世界裡，「AI 趨勢文章」就更加長同一個樣子了。原本還存在的一點多樣性，被進一步壓縮。

這不是一次性的偏差，是一個正回饋迴路：AI 產出公約數 → 人類接受公約數 → 公約數回流為訓練資料 → 下一代 AI 的公約數更強。

在目前 AI Coding 的風潮下，這股迴圈正在以前所未有的速度運轉。大量自動生成的程式碼進入 codebase、進入 GitHub、進入 Stack Overflow 的問答。這些程式碼不是壞的——它們能跑、能用——但它們在風格、架構、解法選擇上的同質化程度，正在以我們沒注意到的速度攀升。

不是 AI 變笨了，是那個盆地的引力變強了。

乘法，不是加法

那怎麼辦？

很多人現在學 AI 是在學「怎麼下提示詞」、「怎麼用工具」、「怎麼串工作流」。這些當然有用，但它們本質上都是在學「如何更好地驅動 AI」。

這裡有一個容易忽略的前提：驅動出來的東西好不好，取決於你能不能判斷。

一個會用各種 AI 工具但不懂程式架構的人，跟一個懂程式架構但還在學 AI 工具的人——後者的天花板遠比前者高。因為前者能很快產出大量的程式碼，但分不出裡面哪些是安慰獎；後者可能產出速度慢一點，但他知道什麼時候該推翻 AI 的建議、什麼時候該接受、什麼地方該自己動手改。

人的能力 × AI 的能力——這是乘法，不是加法。

如果你在某個領域的判斷力是零，不管 AI 那一端的數字多大，乘出來還是零。只是那個零被包裝得很漂亮，看起來像七十分。

如果你在某個領域有紮實的判斷力，AI 會把你的產出速度和涵蓋範圍放大好幾倍。因為你省掉的是勞動密集的部分，保留的是真正需要判斷的部分。你拿到的不是安慰獎，是你自己的作品——只是完成得更快了。

所以，真正該投資的是什麼？

在 AI 大量生產「看起來還不錯」的時代，真正值得投資的，不是學會使用更多工具——那些工具會越來越好用，門檻會越來越低，總有一天誰都會用。

真正值得投資的，是你在輸出領域的判斷力。

你想用 AI 寫出好文章？先讓自己能分辨什麼是好文章。不是「我覺得讀起來通順」那種分辨，是「我知道這段為什麼放在這裡、那段為什麼該刪掉、這個比喻為什麼比另一個好」的分辨。

你想用 AI 寫出好程式？先讓自己理解架構的取捨邏輯。不是「能跑就好」，是知道「為什麼這裡用這個模式，而不是另一個看起來也可以的模式」。

你想用 AI 做出好設計？先讓自己看夠多真正好的設計，建立起你自己的參照系——這樣當 AI 遞給你一個安慰獎的時候，你才聞得出來那不是真正的獎。

這不是什麼高深的哲學。這是一個很實際的生存問題。

當七十分的輸出到處都是、免費供應的時候，七十分的市場價值就會歸零。真正有價值的，是那些明顯不是從統計預設值裡掉出來的東西——那些讓人看了會覺得「這不一樣」的東西。

而那個「不一樣」，不會從更好的提示詞裡來。

它只會從你自己身上來。

話說回來，我上一篇文章裡那兩個模型最後都畫了貓這件事，現在想起來反而成了最好的教材——如果你自己也說不出「為什麼不該是貓」，那你拿到的就永遠只會是貓。不管工具多強，不管你下了多漂亮的提示詞……

從一隻貓開始想

文字和程式碼裡的 10點10分

安慰獎效應

你分辨不出來的，就是你的天花板

正在收緊的迴圈

乘法，不是加法

所以，真正該投資的是什麼？

Related Articles

你無法把判斷力裝進罐頭裡——AI 蒸餾提示詞的認識論困境

目的地（Goal）是行程規劃的必然結果——善用 /goal 的一種思維

最近爆紅的語音輸入工具，我用了一晚就停下來了