Wordpress

穿著學者長袍的人形機器人手指著一本翻開的書中的某一行，向桌邊握著羽毛筆的人類作者展示，作者俯身細看那一處，桌上散著草稿與筆記。兩人姿態的角色顛倒是這幅畫的關鍵，機器人不是被審查的學生，而是替網站做體檢的審稿員。它的手指指向一行不清楚的描述，那個位置就是缺口本身。羽毛筆仍握在人類手中，修正權沒有移交，AI 只是讓人看見哪裡寫得不夠清楚。桌上半抽出的書暗示這不是大規模重寫，而是逐處微調標題、分類描述、文章歸屬，全是站長平常做 SEO 的動作。

反過來用 AI Chatbot 訓練你的網站 SEO

你以為是你在訓練 AI 讀懂網站？其實應該反過來用 AI Chatbot 訓練你的網站，因為 AI 每一次答錯，都是在告訴你哪一篇文章的標題或描述沒寫清楚，幫你檢查網站的 SEO 盲點。RAG Sitemap 捨棄黑箱向量庫，直接讀取 WordPress 裡你早已寫好的標題、分類與描述，生成純文字網站地圖給 AI。你只需要用平常做 SEO 的方式進後台修正，不需要學新工具，也不需要通靈演算法。

文藝復興騎手在懸崖邊緣硬拉韁繩，馬的前蹄就在墜落前一刻剎住，後方是穩固的實地，前方是深暗的峡谷。馬代表 LLM 的天然生成力，本身是高熵的奔騰。韁繩是 harness，一套刻意施加的工程約束。決定性的一瞬發生在每一 hop 的入口，任何一段 Sub Agent 失守，整段推理就墜入累積誤差的深谷。騎手沒有壓制馬，而是把方向收回到自己手裡，這也是 Diving Agent 的角色，握著 Master Sitemap 替整支隊伍決定下潛點。後方的實地對應靜態的 cache 段，提示詞、Master Sitemap、chunk 都站在那裡不動。

RAG Harness Engineering

RAG Harness Engineering 讓訪客的每個提問背後不只是單純的一次 AI 提示詞呼叫，而是看圖、檢索、回答，三段獨立的 AI API。本來多個 Sub Agent 接力最怕的是一站污染一站，但 Harness 架構讓每一站都拿著訪客的原始提問、清楚知道最初的任務目標，從根本上就對污染免疫，累積的雜訊被擋在每一次 hop 的入口之外。

一個渺小、穿著樸素希臘長袍的人形機器人，手提一盞小燈，在一座龐大宏偉的石柱長廊中自信地往深處走去，廊柱朝遠方無止盡延伸。渺小的機器人是 Llama 3B 這種垃圾級小模型，手中的小燈只照亮自己腳下，是它有限的世界知識。但牡步伐自信，因為真正在引路的是周圍的石柱秩序，不是手裡的燈。柱列朝深處延伸，對應 master → category → post 的漸進式披露。模型小不要緊，秩序夠清楚的時候，每一 hop 都收斂成一道選擇題。這幅畫的主角不是機器人，是廊柱本身，能力強弱不是關鍵，結構正確才是。

一個垃圾小模型，竟然讀懂了整個網站

小模型 Llama 3.2 3B，是一個僅有 3B 參數，小到不能再小的語言模型。你問它問題，它只能根據 3B 的訓練資料回答你。它不知道你的網站寫了什麼，不知道你發了哪篇文章，對你近期累積的內容一無所知。用它來跑網頁問答，原本是天方夜譚。

一個小小的人影手裡只拿著一張平面紙地圖，被困在一座巨大的多層石拱與階梯迷宮裡，無止盡的樓梯朝上下四面延伸。平面紙地圖是 llms.txt 的本質，一份只有書名沒有內文的目錄，僅供攝平閱讀。立體迷宮是真實網站的知識結構，有樓層、有動線、有彼此銜接的縱深。人影渺小，工具與環境的尺度落差就是 AI 拿著 2D 清單面對 3D 內容時的處境。光線從一側打入，但沒有對的地圖時，光無法替代結構。RAG Sitemap 要解決的就是把這張平面圖立體化，沿著 master、category、post 三層走下去。

llms.txt 是一份專為 AI 閱讀設計的 sitemap，但它的局限在於只有一層，對有組織、有架構的網站不夠用。這份檔案的標準格式是網站名稱當 H1、一段摘要，底下每一列是一個 [標題](連結)：描述，指向網站裡的一個頁面。但它分不出這一列是分類頁、單一頁面、文章還是商品頁，每一列都被當成同一種東西。初衷沒有錯，目標是讓 AI 更容易地讀懂你的網站。但是問題不在描述，而是在於它把網站壓平成一層，破壞了網站原本的敘事能力與內容脈絡。

一個穿著希臘長袍的人形機器人，在一座宏偉古老圖書館中沿著一座早已雕好的螺旋石梯往上走，朝上方的光線前進，地面上散落著被撚碎、被忽視的紙片。螺旋石梯是 WordPress 既有的分類與階層，雕痕早已存在，不是這位行者刻的。機器人徒步往上走，對應 RAG Sitemap 直接沿著現成路徑檢索的動作。地上被撚碎的紙片是向量化的反向工作，把整理好的內容拆回碎片，再用 cosine similarity 重新拼回去。書架井然排列是人類經營網站時逐篇逐分類完成的低熵沉澱。朝上的光是答案的方位，結構本身在引路，模型只負責讀懂與選擇。

為什麼 RAG 可以不使用向量資料庫？

向量資料庫不是 RAG 的必要條件，它只是其中一種把資料餵給 AI 的方式。當資料本來是混亂的、缺乏清楚邊界的，向量化可以幫助模型從大量文字中猜測語意相關性，這種做法有它的價值。但如果內容本來就有秩序，問題就不再是「怎麼從混亂中硬算相關」，而是「怎麼讓 AI 先看到最重要的判讀線索」。真正有效的 RAG，不一定是先把全文切碎、壓成向量再回頭猜答案；也可以是先把內容整理成 AI 能逐層理解的路徑，先降低上下文的不確定性，再展開細節。

學者的雙手正在校準一個渾天儀的銅環，背後一團黑色擾動的雲霧正在凝聚成渾天儀本身那精準的幾何秩序。黑色雲霧是 LLM 的本來狀態，一個天然高熵的字串生成器，知道一切可能、但每一個可能都同時存在。銅環是熵減的層級，從 prompt、context、agent 到 harness 一圈一圈往外收緊，每一層都壓縮一次條件熵。雙手代表外部做功，秩序不會自己出現，是人類施加結構才有的結果。渾天儀本身是一個有限可知的宇宙模型，被工程約束過的 LLM 也是一樣，不再是無邊界的語言空間，而是一具可預期的工具。

AI 熵減工程

AI 熵減工程是所有讓 LLM 動起來的設計的總稱，從 prompt、context、agent 到 harness 都是在收窄預測的可能性、降低回答的不確定性，只是影響範圍的大小不同。這是因為 LLM 運作在天然高熵的語言介質上，而 AI 應用的核心工程，就是透過結構化輸入與外部知識來執行熵減，以降低不確定性、提升輸出品質。

一群人圍著一個中央光源，每個人手中都接過並捧著自己的一團火焰，光從一處擴散到許多獨立的手心。中央光源是過去十年的雲端 API，所有推理都得回到那一處付帳。光被遞給每雙手，對應的是 NPU、晶片即模型、Chrome Prompt API 這條軌跡，推理被搬回訪客自己的裝置。每團火焰大小相近，意味著邊緣端的小模型能力已經足夠承擔網站的導航任務。雙手環抱火焰的姿勢是私有與不外洩，隱私在這個架構下自然成立。眾人之間距離平均，這不是新中心取代舊中心，而是中心徹底消散。

終極目標：把運算搬到使用者的裝置

「晶片即模型」的意思是，當每台裝置都內建一顆刻進晶片的 AI 小模型，模型不再是需要載入的軟體，而是隨時待命的運算晶片，應用程式所需的 LLM 推理可直接在訪客裝置端就地完成，讓網站主的 AI 運算成本歸零，這正是 RAG Chatbot 的終極目標。

程式碼片段庫