從一隻貓開始想
上一篇文章《貓、煉金爐 與 統計重力》裡,我讓 Gemini 和 ChatGPT 分別去讀我的部落格文章,然後生成作者形象照。結果兩邊都畫了貓。
追問之後發現,這不是什麼深層的文字氣質分析——一個是面對「可愛圖案 T 恤」這個開放指令時的第一直覺,另一個是修正掉錯誤元素之後退回的預設值。路徑不同,終點一樣。我把這個現象叫做「語意空白處的統計重力」:當你沒有明確指定的時候,生成式 AI 會被訓練資料的高頻分佈拉向那個「最安全、最不出錯」的選項。
寫完那篇之後,我一直在想一件事——
如果圖像生成會在語意空白處滑向預設值,那文字呢?程式碼呢?是不是所有生成式 AI 的輸出,都在同一股重力的作用下?
文字和程式碼裡的 10點10分
在上一篇裡,我們已經看過統計重力在圖像生成領域的各種展現——從貓,到永遠停在 10點10分 的手錶指針,到怎麼調都改不過來的美女身材標準(有興趣的可以去看:《貓、煉金爐、與統計重力》)。
但那些畢竟都是圖片。真正讓我開始擔心的,是文字和程式碼。
你有沒有注意過,叫不同的 AI 寫一篇「AI 趨勢觀察」,出來的文章結構幾乎一模一樣?
開頭一定是「AI 正在改變我們的世界」,中間列舉三到五個應用場景,穿插一段「機會與挑戰並存」,結尾收在「讓我們擁抱 AI 的未來」。
這就是文字領域的 10點10分 指針。不是因為這個結構最好,而是因為網路上數以百萬計的科技文章就長這樣。模型讀了這些文章之後,學到了「寫 AI 趨勢,結構就該這樣排」這個高頻模式。
程式碼也一樣。你請 AI 寫一個登入頁面,十個開發者在十個不同的專案裡下了類似的提示詞,拿回來的程式碼結構會高度相似——同樣的框架選擇、同樣的元件拆法、同樣的命名慣例。不是因為那是「最佳實踐」,而是因為那是 GitHub 上 star 最多的 repo、Stack Overflow 上票數最高的答案所呈現的樣子。
訓練資料裡的最大公約數,就是生成輸出的預設目的地。
而這些輸出,看起來都「還不錯」。文章讀起來通順,程式碼能跑,圖片好看。沒什麼大毛病,交出去不會被罵。
但如果每個人拿到的「還不錯」都差不多——那這個「還不錯」還有什麼意義?
安慰獎效應
小時候參加比賽,沒得名次,但離場前工作人員遞給你一個小獎狀或紀念品。那一刻你是開心的——「我也有獎!」——直到你回頭看見,每個人手上都有一份一樣的。
那個從「我得獎了」到「喔,每個人都有」的落差感,就是目前生成式 AI 正在大規模製造的東西。
你下了一個提示詞,AI 在幾秒鐘內給了你一篇完整的文章、一段能跑的程式碼、一張精緻的圖片。你覺得「我完成了」,甚至覺得「這比我自己弄的好多了」。但問題是,隔壁那個人下了差不多的提示詞,也拿到了差不多的東西。再隔壁那個人也是。
每個人都拿到了自己的安慰獎,每個人都很滿意。
但沒有人得到真正屬於自己的東西。
你分辨不出來的,就是你的天花板
安慰獎最巧妙的地方在於:它不會讓你感覺到自己被安慰了。
一個有十年文字經驗的人,看到 AI 生成的文章,會直覺感覺到「結構太順了、轉折太安全了、開頭跟結尾都是套路」。他不一定能說出精確的原因,但他知道「差了一口氣」。所以他會介入——改掉那個太安全的開頭、刪掉那段其實沒必要的過渡、在某個地方插入一個只有他的經驗才會想到的比喻。
一個有十年開發經驗的工程師,看到 AI 生成的程式碼,會聞到「這裡的架構選擇太教科書了」。他知道這個案例有特殊的情境條件,教科書的解法雖然對,但三個月後會變成維護的噩夢。所以他會改——不是改語法,是改判斷。
但一個剛接觸這個領域的人呢?
他看到 AI 的輸出,覺得「不錯啊,比我自己寫得好」——這個判斷可能是對的。但他沒有參照系去分辨那個「不錯」到底是七十分還是九十分。他不知道那是 10:10 的指針,因為他沒看過夠多真正的手錶。他不知道那個程式架構三個月後會爆炸,因為他還沒經歷過那種爆炸。
所以他接受了。發表了。部署了。交付了。
而且他完全不覺得有什麼問題。
AI 是一面放大鏡,但它放大的是你已經有的東西——包括你的盲區。
你在某個領域有判斷力,AI 會讓你飛。你在某個領域沒有判斷力,AI 會讓你很有效率地量產安慰獎,而且全程感覺良好。
正在收緊的迴圈
如果事情只停在「個人拿到安慰獎」,那充其量是個人的問題。但真正讓我開始停下思考的,是接下來這一步。
那些被接受的安慰獎——那些「看起來還不錯」的文章、程式碼、圖片——被發表在網路上,進入了公開的資料庫。而這些資料,會成為下一代模型的訓練來源。
統計重力因此變得更強。盆地變得更深。
原本訓練資料裡「AI 趨勢文章就該這樣寫」的模式,因為越來越多 AI 生成的同結構文章被發表,佔比越來越高。下一代模型看到的世界裡,「AI 趨勢文章」就更加長同一個樣子了。原本還存在的一點多樣性,被進一步壓縮。
這不是一次性的偏差,是一個正回饋迴路:AI 產出公約數 → 人類接受公約數 → 公約數回流為訓練資料 → 下一代 AI 的公約數更強。
在目前 AI Coding 的風潮下,這股迴圈正在以前所未有的速度運轉。大量自動生成的程式碼進入 codebase、進入 GitHub、進入 Stack Overflow 的問答。這些程式碼不是壞的——它們能跑、能用——但它們在風格、架構、解法選擇上的同質化程度,正在以我們沒注意到的速度攀升。
不是 AI 變笨了,是那個盆地的引力變強了。
乘法,不是加法
那怎麼辦?
很多人現在學 AI 是在學「怎麼下提示詞」、「怎麼用工具」、「怎麼串工作流」。這些當然有用,但它們本質上都是在學「如何更好地驅動 AI」。
這裡有一個容易忽略的前提:驅動出來的東西好不好,取決於你能不能判斷。
一個會用各種 AI 工具但不懂程式架構的人,跟一個懂程式架構但還在學 AI 工具的人——後者的天花板遠比前者高。因為前者能很快產出大量的程式碼,但分不出裡面哪些是安慰獎;後者可能產出速度慢一點,但他知道什麼時候該推翻 AI 的建議、什麼時候該接受、什麼地方該自己動手改。
人的能力 × AI 的能力——這是乘法,不是加法。
如果你在某個領域的判斷力是零,不管 AI 那一端的數字多大,乘出來還是零。只是那個零被包裝得很漂亮,看起來像七十分。
如果你在某個領域有紮實的判斷力,AI 會把你的產出速度和涵蓋範圍放大好幾倍。因為你省掉的是勞動密集的部分,保留的是真正需要判斷的部分。你拿到的不是安慰獎,是你自己的作品——只是完成得更快了。
所以,真正該投資的是什麼?
在 AI 大量生產「看起來還不錯」的時代,真正值得投資的,不是學會使用更多工具——那些工具會越來越好用,門檻會越來越低,總有一天誰都會用。
真正值得投資的,是你在輸出領域的判斷力。
你想用 AI 寫出好文章?先讓自己能分辨什麼是好文章。不是「我覺得讀起來通順」那種分辨,是「我知道這段為什麼放在這裡、那段為什麼該刪掉、這個比喻為什麼比另一個好」的分辨。
你想用 AI 寫出好程式?先讓自己理解架構的取捨邏輯。不是「能跑就好」,是知道「為什麼這裡用這個模式,而不是另一個看起來也可以的模式」。
你想用 AI 做出好設計?先讓自己看夠多真正好的設計,建立起你自己的參照系——這樣當 AI 遞給你一個安慰獎的時候,你才聞得出來那不是真正的獎。
這不是什麼高深的哲學。這是一個很實際的生存問題。
當七十分的輸出到處都是、免費供應的時候,七十分的市場價值就會歸零。真正有價值的,是那些明顯不是從統計預設值裡掉出來的東西——那些讓人看了會覺得「這不一樣」的東西。
而那個「不一樣」,不會從更好的提示詞裡來。
它只會從你自己身上來。
話說回來,我上一篇文章裡那兩個模型最後都畫了貓這件事,現在想起來反而成了最好的教材——如果你自己也說不出「為什麼不該是貓」,那你拿到的就永遠只會是貓。不管工具多強,不管你下了多漂亮的提示詞……