訊息增益的基礎是熵

混亂程度減少(熵減)的幅度越大,「訊息增益就越大」

訊息熵　−　剩餘熵　=　訊息增益

H(X) − H(X|Y) = I(X;Y)

Overshoot · Build base · Break out

The breakthroughs in AI entropy engineering are infrastructure forged from repeated wall-hits.

Agent hit a wall; Context backfilled the foundation.

反過來用 AI Chatbot 訓練你的網站 SEO

你以為 RAG 是訓練 AI Chatbot 讀懂網站？其實是在反向校準你的網站 SEO 體質。RAG Sitemap 捨棄黑箱向量庫，直接讀取 WordPress 裡面，你早已寫好的標題、分類與描述，生成 TXT 網站地圖給 AI。當 AI 找不到答案時，問題往往就出在某篇文章的標題、摘要或分類歸屬上，你只需要用平常做 SEO 的方式進後台修正，不需要學新工具，也不需要通靈演算法。

一個垃圾小模型，竟然讀懂了整個網站

小模型 Llama 3.2 3B，是一個僅有 3B 參數，小到不能再小的語言模型。你問它問題，它只能根據 3B 的訓練資料回答你。它不知道你的網站寫了什麼，不知道你發了哪篇文章，對你近期累積的內容一無所知。用它來跑網頁問答，原本是天方夜譚。

為什麼 RAG 可以不使用向量資料庫？

向量資料庫不是 RAG 的必要條件，它只是其中一種把資料餵給 AI 的方式。當資料本來是混亂的、缺乏清楚邊界的，向量化可以幫助模型從大量文字中猜測語意相關性，這種做法有它的價值。但如果內容本來就有秩序，問題就不再是「怎麼從混亂中硬算相關」，而是「怎麼讓 AI 先看到最重要的判讀線索」。真正有效的 RAG，不一定是先把全文切碎、壓成向量再回頭猜答案；也可以是先把內容整理成 AI 能逐層理解的路徑，先降低上下文的不確定性，再展開細節。

AI 熵減工程

AI 熵減工程 — LLM 是熵源，使用方法是熵減。

為什麼 LLM 可被視為「熵」

使用方法為何就是「熵減」

訊息增益的基礎是熵

從 Prompt 到 Harness Engineering

熵減工程的四次躍遷

Overshoot · Build base · Break out

相關文章

反過來用 AI Chatbot 訓練你的網站 SEO

一個垃圾小模型，竟然讀懂了整個網站

為什麼 RAG 可以不使用向量資料庫？

Contact

Visit Us

Follow Us

Our Newsletter