Map
get
Truth
Vectors
find
Scraps
RAG Sitemap 是一份為 AI 檢索而設計的結構化網站知識索引,它不是 sitemap.xml,也不是向量資料庫,它是有跡可循的脈絡,是一份標出各群組邊界與關係的頂層導覽文件,描述整個網站知識全景,讓 AI 沿著結構走向答案,而不是在語意相似度中碰運氣。
為什麼 RAG 可以不使用向量資料庫?
向量資料庫並不是 RAG 的必要條件,它只是其中一種把資料餵給 AI 的方式 —
The Curator’s Guide
Lorem ipsum dolor sit amet, consectetur adipiscing elit […]
Progressive Disclosure
為站內對話建立的索引,同時就是 AI 搜尋引擎理解你的方式
對話機器人沿著它找答案,AI 搜尋引擎沿著它找到你
Progressive Disclosure
為站內對話建立的索引,同時就是 AI 搜尋引擎理解你的方式;對話機器人沿著它找答案,AI 搜尋引擎沿著它找到你
「先用結構化摘要建立全貌,再依問題線索精準定位並深入檢索」這個邏輯,其實已經出現在很多地方。Google 從來不是把整個網路讀完再排名,它先看標題和 H1,再看 meta description,再看 Schema.org 結構化資料,最後才深入正文,這是成本控制的必然結果。2024 年開始流傳的 LLMs.txt 概念正確地識別了問題,但現有實作大多只是一份連結清單,AI 拿到之後就像猪八戒吃人參果 — 整份吞下去,再好的內容也嚐不出味道。
Anthropic 為 Claude Code 推出的 Skill.md 改善的也是這件事:在專案文件的開頭放一段描述文字,讓 Claude 只在需要時才載入整個專案的上下文,而不用每次都載入所有知識。而 GEO(生成式引擎優化)的核心假設也一樣,AI 搜尋引擎在索引網站時,用輕量模型快速掃描,決定哪些內容值得深入,這個篩選層的輸入,就是你的網站地圖。這些概念指向同一個結論:在資訊過載的時代,AI 最需要的不是更多資料,而是一個精心設計的漸進式披露架構。
RAG Sitemap 的核心設計原則叫做漸進式披露(Progressive Disclosure),這不是把所有內容一次餵給 AI,而是沿著網站自身的分類脈絡,一層一層地引導它從全局走向細節。讓 AI 先讀取 Master Sitemap 這份頂層索引,理解整個網站的知識結構:有哪些內容群組、每個群組涵蓋什麼主題、各群組之間的邊界在哪裡。然後依據問題的類型,選擇對應的內容群組,在群組內精準檢索,最後只讀取真正相關的內容片段,生成精準回答。
— RAG Sitemap 是這個概念在網站層面的完整實現
RAG Chatbot
不用花時間整理 RAG 資料庫
你花了大量時間建立的 WordPress 文章、分類、產品頁等,其實就是在整理 RAG 資料庫,問題只是 AI 不知道從哪裡開始讀你的網站。
可用於各種使用情境
不管你的網站是什麼類型,讓你的網站用你的語氣、你的內容,全天候自動回答訪客的問題。不需要研究複雜的向量資料庫,直接用 RAG Sitemap 讓你的部落格變成會說話的知識庫 —


