作者 @wquguru 認為前面四層(規則、畫像、歷史、證據)本質上都還是 recall——想起過去發生過什麼。Agent memory 真正的分水嶺在下一層:self-evolution,這也是他眼中「記憶複利」的來源。

作者的論點:從 recall 到 self-evolution

他把這一層拆成四個遞進的動作:

  • Recall:想起過去發生過什麼。
  • Reflection:總結過去為什麼成功或失敗。
  • Skill extraction:把重複成功的路徑沉澱成可複用的流程。
  • Dreaming:在空閒時離線整理,而不是每輪在線臨時往上下文裡塞東西。

他指出 OpenClaw 的 dreaming、Hermes 的 post-turn self-improvement review、Claude Code 的 auto memory、EverOS 的 agent cases 與 skills,本質都朝這個方向走。原文舉的例子是一條「回測框架與策略經濟性結論」的記憶,已接近經驗沉澱:它把多個時間窗口、多個標的、多組參數格子的實驗整理成策略判斷——高換手弱信號結構性淨負、降換手是核心槓桿、窄樣本容易誤判、夠寬的標的池與更長窗口才看得到穩定性、回測資料源必須與真實交易所閉環。這類結論若只停在聊天紀錄裡,下次 agent 又從「跑一次看看」開始;一旦沉澱成 memory,下一輪可直接從更高層起步。

第五條設計原則:Agent memory 的終局不是「記住更多」,而是少犯同樣的錯、更快複用做對過的事。這正是他所謂的「複利」。

學術脈絡:reflection 不是新概念

作者口語化的「reflection → skill」其實對應到 Stanford Generative Agents(Park et al., 2023)裡明確的 reflection 機制:系統定期用最近約 100 條記憶記錄,要 LLM 提出幾個高層問題,再針對每個問題檢索記憶、生成高層洞察,並把這些洞察寫回 memory stream,讓 agent 能遞迴地對先前的反思再做反思。換言之,「把經驗壓縮成更高層的判斷、再存回記憶」是有 2023 年學術原型的,作者的貢獻是把它放進 2026 年工具生態(dreaming、auto memory、skills)的語境重新講清楚。

值得補充的客觀區分:

  • 「離線反思」vs「在線堆疊」是真實且重要的取捨。每輪在線臨時往 context 塞歷史,既貴又稀釋注意力;把整理挪到空閒時離線做(dreaming),讓常駐記憶保持精煉,這個方向與業界對「context 預算」的關注一致。
  • 自我反思也可能放大錯誤:若 reflection 建立在被污染或被誤判的記憶上,沉澱出的「技能」會把錯誤固化成預設行為。這與後面「記憶新風險」一節相互呼應——self-evolution 的複利是雙向的,做對會加速、做錯也會加速。

延伸