但是,當它配合 RAG Sitemap 一鍵生成的結構化索引地圖後,就讓 Llama 3.2 3B 能夠回答一個關於中型 WordPress 網站的問題。甚至拿 Gemini Flash Lite 或 GPT nano 來跑這套系統的話,更是牛刀小試。一個小模型能讀懂整個網站,不是因為它聰明,是因為我們不再把混沌丟給它,而是把網站轉化為一張結構清晰,可以直觀判斷的低熵地圖。
為什麼小模型做得到?
大模型與小模型最大的差異,其實不是「智商」,而是「世界知識」。一個只能正常說話的 3B 模型無法像 70B 模型那樣記住全網資訊,而就算模型吸收了再多的世界知識,也還是會遇到時效性問題。但如果問題的範圍被鎖定在你的網站內,小模型的推理能力並不差,而真正的問題是:就算它有推理能力,它怎麼知道答案在哪裡?
RAG Sitemap 解決了這個問題,而且解決得幾乎沒有摩擦力。因為你的分類目錄、頁面層級、文章架構,本身就是一張整理好的知識地圖,而 RAG Sitemap 透過直接讀取 WordPress 既有的內容架構,幫助你一鍵轉換為 AI 看得懂的純文字導航圖,不需要學習什麼是向量、不需要外接任何資料庫。因為模型不需要每次回答問題時都讀懂整個網站,它只需要沿著這張現成的地圖走,就知道該往哪裡找答案。
帶領小模型走進既有脈絡:RAG Sitemap 的沉浸式導航
同一個網站的內容,用兩種維度遞給 AI。向量檢索將其解構、切碎成一地去脈絡的紙片,拋入高維度的抽象空間,讓模型在黑暗中憑相似度盲目拼湊;而 RAG Sitemap 則完整保留了人類發文時精心編排的有機層級。小模型無須在混沌中摸索,它只需睜著眼站在路口,順應路標、做出抉擇,在川流不息的秩序中直覺地抵達答案。
柏格森的兩種認識:外部的「分析」與內部的「直觀」
分析:Embedding
停留在外部的符號化約柏格森指出,「分析」是觀察者停留在事物外部,將其化約為死板的符號與空間表徵。這正如傳統向量檢索:將流動的內容切割為冰冷的 Chunk,壓平為無方向感的數學座標。它中止了文本的生命力,使小模型只能在外部算盡距離,在拼圖般的相似度迷宮中,勉強拼湊失去有機脈絡的知識碎片。
直觀:RAG Sitemap
進入事物內部的理智同情柏格森推崇的「直觀」,是打破一切符號中介,直接投身對象內部,產生「理智的同情(intellectual sympathy)」以把握其獨特的生命流動。RAG Sitemap 正是這條直觀之路。它不解構、不扭曲,讓小模型直接沉浸於站主編織的既有脈絡中。模型沿著現成的意圖流動、判讀,直觀地擁抱網站整體的知識魂魄。
這正是 3B 小模型能優雅破解中型網站檢索的核心祕密:它不需要擁有吞噬世界的龐大參數量,只需要繼承人類早就已經梳理好的秩序。小模型只需透過 RAG Sitemap 就能理解語意、定位群組、選擇內容並回答訪客問題。直觀不是退而求其次的模糊手段;恰恰相反,當結構正確時,直觀是最精確、最有效率的路徑。能讓小模型讀懂的秩序,AI 搜尋引擎也讀得懂,這同時也是最直接的 SEO 演練與成本優勢。
