為什麼 LLM 可被視為「熵」
從資訊論角度,熵衡量的是「不確定性」與「混亂程度」。自然語言本身就是高熵訊號,同一個問題可以有一百種合理但品質參差的回答。LLM 作為基於機率分布生成 token 的模型,其輸出空間極大,未經約束時本質上處於高熵態,容易產生幻覺或無關內容。
使用方法為何就是「熵減」
熵增定律指出,在封閉或是孤立的系統中,混亂自然增加(即熵增);若要逆轉混亂,恢復有序,必須從外部輸入資訊與結構。而你對 LLM 做的每一件事,幾乎都是在做這種「外部做功」:
- 提示工程 / 上下文工程
- 透過精確描述、角色設定與範例,縮小模型可輸出的合理範圍,也就是在降低條件熵。
- RAG 與知識庫檢索
- 不讓模型只靠內部高權重的模糊記憶回答,而是即時注入經過篩選的外部低熵事實,直接壓縮不確定性。
- 結構化輸出與格式約束
- JSON 模式、函數呼叫、嚴格模板,都是把無邊界的語言空間壓縮成有秩序的低熵輸出。
換句話說,LLM 的「聰明」其實來自於它內化了人類語言的龐大統計規律;但它「不準」的時候,正是因為這個機率空間太自由。你的使用方法無論是寫提示詞、做 RAG、還是建立結構化上下文 — 本質上都是在用外部資訊與規則來壓縮熵。
訊息增益的基礎是熵
混亂程度減少(熵減)的幅度越大,「訊息增益就越大」
LLM 本身是一個高訊息熵的字串生成器,它知道一切可能的字串,但每一個答案都有可能發生。所有讓 LLM 動起來、能完成任何事情的工程都是熵減:prompt 注入是熵減、context 設計是熵減、agent 規劃是熵減、harness 搭建是熵減。熵減工程的目的是消除不確定,而多餘的錯誤雜訊不會讓 LLM 更精確,只會讓它更肯定地答錯。
從 Prompt 到 Harness Engineering
熵減工程的四次躍遷
AI 熵減工程的演進,是一場持久戰,對抗的是語言的不確定性。從 Prompt 開始作為最早的熵減手段出現,以精確指令收窄模型的輸出空間;到了 2023 至 2024 年,新興的 Agent 架構試圖讓 AI 自主行動,把單次生成接成迴圈,但這也讓熵在一步步迭代中累積,最終徹底失控。
撞牆之後才發現,少的是 Context 這塊基礎建設:在每一步重新注入結構化的知識與目標,讓模型開口前先有根據。但把每一步餵準,還不等於整個系統能夠持續推進。進入 2026,Harness 的概念確立,將前三者系統化整合,把降熵的鐵則焊進 AI 運作的系統,讓模型在自由發揮之餘,行為始終約束在安全的邊界內,不致脫韁。
Overshoot · Build base · Break out
The breakthroughs in AI entropy engineering are infrastructure forged from repeated wall-hits.
Agent hit a wall; Context backfilled the foundation.
