AI memory（Agent Memory 架構）

Agent Memory 已經從「把對話存進向量庫」分化成一整套分層架構：規則、畫像、歷史、證據、治理、反思與技能沉澱，各有各的儲存方式、載入時機與治理難題。這個專欄以 X 帳號 @wquguru 在 2026-06-24 發表的長文〈Agent Memory 架构全景：从规则文件、会话检索到反思与技能沉淀〉為主要一手來源，把他的論述完整拆解、補上業界脈絡與學術對照，並且全程區分「作者主張」與「可獨立佐證的事實/業界共識」。

一手來源：@wquguru 原文（X Article，2026-06-24）。需要說明的是，這篇文章在收尾處推介了作者所屬團隊 EverMind-AI 的開源專案 EverOS，因此它同時是一篇技術綜述、也是一篇帶有產品立場的觀點文；本專欄把「對記憶架構的觀察」與「對特定產品的主張」分開處理。

這個主題用「原子筆記」組織：每篇只談一個面向，彼此用連結串起來。下面是建議閱讀順序，但每篇都能單獨看。

學習路徑

長上下文、RAG 與記憶的分工　為什麼 256K／1M context window 解決不了「下一輪醒來還記不記得」這件事
規則記憶：Agent 的工作憲法　CLAUDE.md／AGENTS.md，可讀可審計、進 Git 的第一層記憶
常駐畫像與歷史召回　每輪都要付 token 稅的「索引頁」，與安靜躺在磁碟上的「資料庫」
證據鏈與治理記憶　記住結論不夠，得記住憑什麼；權限、紅線、狀態的可審計記憶
反思與技能沉澱：記憶的複利　從 recall 到 self-evolution，少犯同樣的錯、更快複用做對過的事
落地工程：四應用對照、EverOS 與業界記憶層　Claude Code／Codex／OpenClaw／Hermes 的分工，與 MemGPT／Letta／mem0 的對照
客觀檢視：作者主張 vs 業界共識、風險與盲點　哪些是觀察、哪些是推論、哪些是產品行銷

🔍 待解問題 / 持續追蹤

「五層架構」是作者個人的整理框架，並非業界公認的標準分類；它與學術界常用的「參數記憶 vs 非參數記憶」「短期 vs 長期」「情節 vs 語意 vs 程序」等切法如何對得起來？
規則檔（CLAUDE.md／AGENTS.md）、自動記憶、向量召回三者的邊界，各家工具的官方定義是否一致？跨工具可攜性（@import、symlink）目前有哪些已知坑？
「常駐記憶要短、硬、高密度」是好原則，但「多短才算短」缺乏量化標準；超限報錯（Hermes 式）與靜默壓縮各自的失效模式是什麼？
記憶治理（來源／置信度／過期性／可刪除性）目前多停留在設計原則層面，有沒有可落地、可驗證的工程實作與評測基準？
記憶投毒（memory poisoning／MINJA／MemoryGraft）等持久化攻擊面，在「Markdown 可讀可 diff」的設計下是否真的更可防禦，還是只是更可事後追查？
EverOS 這類「Markdown as source of truth + SQLite + LanceDB」的工程起點，相較 mem0／Letta 的黑盒召回層，在真實長跑專案裡的維護成本與召回品質孰優？

🕒 更新紀錄

2026-06-27 — 建立專欄。以 @wquguru 2026-06-24 原文為主一手來源，拆成 1 篇 hub＋7 篇原子筆記；補入 Claude Code 官方記憶文件、Stanford Generative Agents 反思機制、MemGPT／Letta／mem0 記憶層對照、記憶投毒研究等 login-free 外部脈絡，並全程標示主張與可佐證事實的分界。

我的知識庫

探索

AI memory（Agent Memory 架構）

學習路徑

🔍 待解問題 / 持續追蹤

🕒 更新紀錄

反思與技能沉澱：記憶的複利

客觀檢視：作者主張 vs 業界共識、風險與盲點

常駐畫像與歷史召回

落地工程：四應用對照、EverOS 與業界記憶層

規則記憶：Agent 的工作憲法

證據鏈與治理記憶

長上下文、RAG 與記憶的分工