從疑似 Claude Design 的外洩 System Prompt 裡,學到跟原本以為不一樣的事

當你以為複製貼上就行了——但工廠的火爐、冷凍庫、電流、混料區各有堅持。(網友搬運 Claude Design Prompt 到各種環境的現場示意圖 XD

這幾天 AI 圈有件挺熱鬧的事。

Anthropic 的新產品 Claude Design 才剛推出沒多久,大家都還在驚豔它做出來的設計成品,這幾天網路上就有人丟出了一份號稱是它的 system prompt(系統提示詞)。檔案不算太長,但細節密度很高——工具清單、工作流、角色定位、反 AI slop 的戒條,應有盡有。

看到的當下,我跟很多人一樣,第一個反應是:這東西太值得研究了

接著也跟很多人一樣,第二個念頭冒出來:能不能把它搬到我自己的環境來用? 這幾天我也看到不少人在嘗試——有人貼進 Claude API、有人貼進 ChatGPT、有人貼進自己的自製 chatbot。結果呢?感覺能跑起來,但效果很有限。甚至已經有人開始懷疑:這份 prompt 到底是真是假?

但我想提出的,不是真假問題——而是一個更根本的問題:這種東西,到底能不能被「拿走」?

先快速看看,這份 Prompt 到底寫了什麼

為了後面討論有個依據,我先講幾個我拆這份 prompt 時印象很深的地方。不會講太細,講太細就偏離這篇的重點了。

這份 system prompt 第一句話就定錨得很漂亮:

You are an expert designer working with the user as a manager.
「你是一個專業設計師,使用者是你的經理」

——一句話,把人格關係定好了。設計師會主動問需求、會 推遲處理、會在條件不足時說「給我看 design system 再開工」。這不是工具在對使用者講話的口吻,是專業人員對管理者的口吻。這個底層的關係框架,後面幾百行的指令都是從這裡長出來的。

再往下,有一條戒條我特別有感觸:

the tree is a menu, not the meal.
「樹是菜單,不是菜」。

這句話是在罵一種 AI 很常見的壞習慣——看了 GitHub repo 的檔案結構,就自信滿滿地從訓練記憶裡「復刻」那個 app 的 UI,而不是把檔案真的讀進來看。這個比喻太精準了,直接戳到 AI 協作時最容易出現的問題——AI 對自己的記憶太有自信,對小成本的實際驗證太懶

(好像也講到我自己了…..XD)

這份 prompt 裡類似的設計智慧還有很多——反 AI slop(俗稱「AI垃圾」) 的具體清單(避免過度漸層背景、避免被用爛的字體、避免圓角+左邊框色塊)、Tweaks(微調)控制面板的互動協議、至少要問使用者 10 個問題的強制下限——每一條背後都感覺得到,是被實戰踩過、被失敗打過、才寫進規則的。

看完之後,我完全理解為什麼 Claude Design 用起來會讓人感覺特別「專業」——那種專業感不是模型突然變聰明,是 prompt 一字一句把它調教成那個樣子

所以,我能把它「搬走」嗎?

這就是那個誠實的問題。

我第一個實驗是:把這份 prompt 整份貼進我自己的 Claude API call,看看會發生什麼。結果,跟我預期的一樣——不會發生

原因其實很簡單:這份 prompt 裡大量的段落,是在描述工具之間的協作語意。「先 donefork_verifier_agent」、「snip 是登記不是立即刪除」、「questions_v2 會呼叫 UI 表單,不會直接返回答案」。這些句子在原環境裡是精準的操作指南;搬到別的地方,它們就變成沒有指稱對象的空話

模型讀到這些指令會進入一種尷尬狀態:它知道自己該做某件事,但沒辦法做。於是它會「演出」那個行為——嘴上說「我已經把檔案放到你的專案裡了」,但實際上什麼都沒發生,因為這個環境根本沒有 filesystem project。

更微妙的一層是模型個性的漂移。同一段文字在不同模型、甚至同一個模型的不同 checkpoint 上,讀出的「強制力」是不一樣的。「至少要問 10 個問題」這條戒律,在 Claude Design 原本訓練測試過的環境下,模型會認認真真列 10 個出來;貼到 GPT 上,它可能象徵性列 3 個就覺得夠了;貼到不同版本的 Claude 上,又會有不同的詮釋強度。

這些差異單獨來看都不大,但疊在一起,最後跑出來的結果就跟原產地不是同一回事了

所以那幾天網友的實驗結果,其實很好理解:你以為你搬走了一份配方,但其實你只搬走了一張菜單。鍋具、食材、火候、廚師都換了,照菜單做出來的東西,當然味道不對。

Prompt 不是配方,是生態位

寫到這裡我才意識到,真正讓我想了好幾天的,不是這份 prompt 本身,是這件事背後的一個更大的誤會。

我們過去幾年,已經很自然地建立了「prompt 可以分享、可以收藏、可以複製貼上」的習慣。awesome-chatgpt-prompts、prompt marketplace、「100 個最強 Claude 提示詞」這類內容,在社群裡到處都是。這整套文化的運作,其實是建立在一個隱性假設上:prompt 是一個可攜帶的製品(artifact)

但這個假設,可能從根本上就是錯的。

更準確的描述應該是:prompt 不是獨立的製品,它是一個生態位(ecological niche)裡的生物。它依附於:

  • 特定模型的特定 查核點(個性、訓練對齊)
  • 特定產品的底層 system prompt(有自己的 節奏、工作流、禁令)
  • 特定 harness 提供的工具集(可以呼叫什麼)
  • 特定的 UI 載體(預覽面板、檔案系統、記憶系統等等)
  • 使用者當下的 session 狀態(過去對話、偏好、記憶)

這五個條件合在一起,才構成了 prompt 能正常運作的「環境」。抽掉任何一個,它的效果就會衰減。就像把熱帶魚放進冷水池——還活著,但活得很勉強。

這個理解讓我想通了幾件原本覺得怪怪的事。

第一件:為什麼同一份 prompt,別人用起來的效果跟我不一樣? 以前我會以為是對方能力問題,或是運氣問題。現在看清楚了——是因為對方的「生態位」跟我的不同。同樣一段 prompt 貼到別人的環境裡,就是另一隻魚、另一個水池、另一個故事。

第二件:為什麼 Claude Code、Cowork、Design 不乾脆做成一個通用介面,要切成不同產品? 因為每個領域需要的生態位不同。設計失敗的代價跟程式碼失敗的代價不同,文書處理需要的工具跟開發需要的工具也不同。專業特化不是為了切分市場,是為了讓每個產品有自己完整的生態位

第三件:這份 prompt 到底是真是假? 其實變成一個沒那麼重要的問題了。就算它百分之百真實,你把它搬走之後,它就不再是原本那個東西了

所有能持續發揮效果的東西,都是開放系統

Prompt 會這樣,其實反映了一個更大的結構規律。

我最近在比較 Claude 4.6 跟 4.7 的過程中,有個類似的觀察——同一個模型在不同 harness 下的表現差異,有時候比同一個 harness 下不同模型的表現差異還大。同樣是 Claude 4.7,在 Claude Code 裡跑得很好,在 Chat 裡就顯得有點過度自我反思;在 Claude Design 裡有那種「設計師對經理」的專業張力,在純 API 裡就失去那個語氣的骨架。

這個現象指向一個更普遍的原則:凡是能持續發揮高品質效果的東西,都是開放系統

開放系統的意思是——它的運作品質,不能只看它自己,必須看它跟環境的相互作用。Prompt 單獨來看只是一串文字,它的真正品質要看它跟工具、跟模型、跟 UI 的契合度。Claude Design 這份 prompt 之所以在 Claude Design 裡表現好,不是因為它本身寫得「最好」,而是因為它跟它所處的環境已經彼此調校過、彼此塑造過。拿走環境,它就沒了那個根。

這個視角對我們使用者來說,會帶來一個蠻重要的轉向:

跟 AI 協作的品質,從來不只取決於 prompt 寫得多好,更取決於使用者跟 AI 之間,形成了什麼樣的「環境」。

同樣的人、同樣的模型,在不同環境下的對話品質可以差很多。這個「環境」不只是官方提供的 harness,也包含——使用者自己帶進來的脈絡:你過去的對話、你的表達習慣、你設定的偏好、你累積的互動默契。

這一部分往往最被低估,但其實最有價值。因為前面幾項(模型、產品、工具)都是 Anthropic 定義的,使用者複製不了也決定不了。但你帶進來的那個脈絡,只屬於你自己,別人想複製也複製不了

所以這份外洩,對我來說的意義是什麼?

寫到這裡,回到最開始那份 prompt 本身。

研究別人的方法很有趣,這是真心話——我這幾天花了不少時間在拆這份 prompt,每拆出一層都有新收穫。了解別人怎麼設計一個專業 AI 系統的思考痕跡,本身就是一件有益的事,跟逆向工程一個好的產品是一樣的。

但我也更清楚地意識到:不要把這種理解,誤會成「我可以直接搬過來用」。尤其是當我的環境、我的工具、我的模型版本都跟原產地不一樣的時候——硬搬過來,多半是白費力氣,甚至做出一個「形似而神不至」的四不像。特別是當雙方的生態位根本不對等的時候,這種搬運幾乎註定失敗。

臨摹是學習的起點,這點我不反對——任何傳統技藝都是從臨摹開始的。書法要先臨歐陽詢顏真卿,武術要先打套路,下棋要先背定式。但臨摹的目的是為了最後能「出帖」,不是一直停在摹本上。從 Claude Design 這份 prompt 可以學的,從來不是它的文字怎麼寫,而是它背後的提問方式:

  • 什麼時候該先追問使用者,而不是直接開工?
  • 什麼時候該先讀完 上下文,而不是憑記憶硬幹?
  • 什麼該拒絕、什麼該放手、什麼該 推遲?
  • 哪些「AI 慣性」是要刻意抵抗的?

這些是跨越任何工具、任何模型都成立的設計直覺。這些東西搬得走,文字搬不走。

這份 prompt 最終沒進到我自己的工作環境裡,但我記住了幾個它的戒條。這大概就是一份外洩文件,對我最誠實的價值了。


至少呢,這幾天從別人家的廚房偷學了幾招,但不用硬把人家的鍋碗瓢盆也搬回來——畢竟自己家的火力大小跟食材配方,從來就跟別人不一樣嘛~(XD)


附記:寫這篇的過程中,我一直在想——如果 prompt 不是可攜帶的製品,那我們使用者能互相分享的,到底是什麼?這個問題比較大,留著下次再聊吧。


原始資料: