/rag-sitemap/ │ ├── default/ ← Main Language │ │ │ ├── master-sitemap.txt ← sitemap │ │ ├─ ====== │ │ ├─ Page Title / Link / Description │ │ ├─ Rag_Item_Link: (page_aaa.txt URL) │ │ ├─ ====== │ │ ├─ Page Title / Link / Description │ │ ├─ Rag_Category_Link: (category_list_z.txt URL) │ │ └─ ====== │ │ │ ├── category-list/ │ │ ├── category_list_x.txt │ │ ├── category_list_y.txt │ │ └── category_list_z.txt │ │ │ │ │ └── Each Category_List.txt │ │ ├─ ====== │ │ ├─ Category Title / Link / Description │ │ ├─ Rag_Item_Link: (post_xxx.txt URL) │ │ └─ ====== │ │ │ ├── post-chunks/ │ │ ├── post_2993.txt │ │ ├── post_2999.txt │ │ └── post_3105.txt │ │ │ │ │ └── Each Single_Post.txt │ │ ├─ Title: … │ │ ├─ Link: … │ │ ├─ Date: … │ │ └─ Content: … │ │ │ └── page-chunks/ │ ├── page_aaaa.txt │ └── page_bbbb.txt │ │ │ └── Each Page_Post.txt │ ├─ Title: … │ ├─ Link: … │ ├─ Date: … │ └─ Content: … │ ├── jp/ │ ├── master-sitemap.txt │ ├── category-list/ │ ├── post-chunks/ │ └── page-chunks/ │ └── ko/ ├── master-sitemap.txt ├── category-list/ ├── post-chunks/ └── page-chunks/

一個渺小、穿著樸素希臘長袍的人形機器人，手提一盞小燈，在一座龐大宏偉的石柱長廊中自信地往深處走去，廊柱朝遠方無止盡延伸。渺小的機器人是 Llama 3B 這種垃圾級小模型，手中的小燈只照亮自己腳下，是它有限的世界知識。但牡步伐自信，因為真正在引路的是周圍的石柱秩序，不是手裡的燈。柱列朝深處延伸，對應 master → category → post 的漸進式披露。模型小不要緊，秩序夠清楚的時候，每一 hop 都收斂成一道選擇題。這幅畫的主角不是機器人，是廊柱本身，能力強弱不是關鍵，結構正確才是。

一個垃圾小模型，竟然讀懂了整個網站

小模型 Llama 3.2 3B，是一個僅有 3B 參數，小到不能再小的語言模型。你問它問題，它只能根據 3B 的訓練資料回答你。它不知道你的網站寫了什麼，不知道你發了哪篇文章，對你近期累積的內容一無所知。用它來跑網頁問答，原本是天方夜譚。

文藝復興騎手在懸崖邊緣硬拉韁繩，馬的前蹄就在墜落前一刻剎住，後方是穩固的實地，前方是深暗的峡谷。馬代表 LLM 的天然生成力，本身是高熵的奔騰。韁繩是 harness，一套刻意施加的工程約束。決定性的一瞬發生在每一 hop 的入口，任何一段 Sub Agent 失守，整段推理就墜入累積誤差的深谷。騎手沒有壓制馬，而是把方向收回到自己手裡，這也是 Diving Agent 的角色，握著 Master Sitemap 替整支隊伍決定下潛點。後方的實地對應靜態的 cache 段，提示詞、Master Sitemap、chunk 都站在那裡不動。

RAG Harness Engineering

RAG Harness Engineering 讓訪客的每個提問背後不只是單純的一次 AI 提示詞呼叫，而是看圖、檢索、回答，三段獨立的 AI API。本來多個 Sub Agent 接力最怕的是一站污染一站，但 Harness 架構讓每一站都拿著訪客的原始提問、清楚知道最初的任務目標，從根本上就對污染免疫，累積的雜訊被擋在每一次 hop 的入口之外。

穿著學者長袍的人形機器人手指著一本翻開的書中的某一行，向桌邊握著羽毛筆的人類作者展示，作者俯身細看那一處，桌上散著草稿與筆記。兩人姿態的角色顛倒是這幅畫的關鍵，機器人不是被審查的學生，而是替網站做體檢的審稿員。它的手指指向一行不清楚的描述，那個位置就是缺口本身。羽毛筆仍握在人類手中，修正權沒有移交，AI 只是讓人看見哪裡寫得不夠清楚。桌上半抽出的書暗示這不是大規模重寫，而是逐處微調標題、分類描述、文章歸屬，全是站長平常做 SEO 的動作。

反過來用 AI Chatbot 訓練你的網站 SEO

你以為是你在訓練 AI 讀懂網站？其實應該反過來用 AI Chatbot 訓練你的網站，因為 AI 每一次答錯，都是在告訴你哪一篇文章的標題或描述沒寫清楚，幫你檢查網站的 SEO 盲點。RAG Sitemap 捨棄黑箱向量庫，直接讀取 WordPress 裡你早已寫好的標題、分類與描述，生成純文字網站地圖給 AI。你只需要用平常做 SEO 的方式進後台修正，不需要學新工具，也不需要通靈演算法。

llms.txt

llms.txt 善意的局限：為什麼連結清單不夠用

從 2D 到 3D：RAG Sitemap 如何重建網站知識骨架

專為 AI 檢索設計的檔案架構：透明、分層、多語系

相關文章

一個垃圾小模型，竟然讀懂了整個網站

RAG Harness Engineering

反過來用 AI Chatbot 訓練你的網站 SEO