Agent Memory 已經從「把對話存進向量庫」分化成一整套分層架構:規則、畫像、歷史、證據、治理、反思與技能沉澱,各有各的儲存方式、載入時機與治理難題。這個專欄以 X 帳號 @wquguru 在 2026-06-24 發表的長文〈Agent Memory 架构全景:从规则文件、会话检索到反思与技能沉淀〉為主要一手來源,把他的論述完整拆解、補上業界脈絡與學術對照,並且全程區分「作者主張」與「可獨立佐證的事實/業界共識」。
一手來源:@wquguru 原文(X Article,2026-06-24)。需要說明的是,這篇文章在收尾處推介了作者所屬團隊 EverMind-AI 的開源專案 EverOS,因此它同時是一篇技術綜述、也是一篇帶有產品立場的觀點文;本專欄把「對記憶架構的觀察」與「對特定產品的主張」分開處理。
這個主題用「原子筆記」組織:每篇只談一個面向,彼此用連結串起來。下面是建議閱讀順序,但每篇都能單獨看。
學習路徑
- 長上下文、RAG 與記憶的分工 為什麼 256K/1M context window 解決不了「下一輪醒來還記不記得」這件事
- 規則記憶:Agent 的工作憲法 CLAUDE.md/AGENTS.md,可讀可審計、進 Git 的第一層記憶
- 常駐畫像與歷史召回 每輪都要付 token 稅的「索引頁」,與安靜躺在磁碟上的「資料庫」
- 證據鏈與治理記憶 記住結論不夠,得記住憑什麼;權限、紅線、狀態的可審計記憶
- 反思與技能沉澱:記憶的複利 從 recall 到 self-evolution,少犯同樣的錯、更快複用做對過的事
- 落地工程:四應用對照、EverOS 與業界記憶層 Claude Code/Codex/OpenClaw/Hermes 的分工,與 MemGPT/Letta/mem0 的對照
- 客觀檢視:作者主張 vs 業界共識、風險與盲點 哪些是觀察、哪些是推論、哪些是產品行銷
🔍 待解問題 / 持續追蹤
- 「五層架構」是作者個人的整理框架,並非業界公認的標準分類;它與學術界常用的「參數記憶 vs 非參數記憶」「短期 vs 長期」「情節 vs 語意 vs 程序」等切法如何對得起來?
- 規則檔(CLAUDE.md/AGENTS.md)、自動記憶、向量召回三者的邊界,各家工具的官方定義是否一致?跨工具可攜性(@import、symlink)目前有哪些已知坑?
- 「常駐記憶要短、硬、高密度」是好原則,但「多短才算短」缺乏量化標準;超限報錯(Hermes 式)與靜默壓縮各自的失效模式是什麼?
- 記憶治理(來源/置信度/過期性/可刪除性)目前多停留在設計原則層面,有沒有可落地、可驗證的工程實作與評測基準?
- 記憶投毒(memory poisoning/MINJA/MemoryGraft)等持久化攻擊面,在「Markdown 可讀可 diff」的設計下是否真的更可防禦,還是只是更可事後追查?
- EverOS 這類「Markdown as source of truth + SQLite + LanceDB」的工程起點,相較 mem0/Letta 的黑盒召回層,在真實長跑專案裡的維護成本與召回品質孰優?
🕒 更新紀錄
- 2026-06-27 — 建立專欄。以 @wquguru 2026-06-24 原文為主一手來源,拆成 1 篇 hub+7 篇原子筆記;補入 Claude Code 官方記憶文件、Stanford Generative Agents 反思機制、MemGPT/Letta/mem0 記憶層對照、記憶投毒研究等 login-free 外部脈絡,並全程標示主張與可佐證事實的分界。