Agent Memory/下一個決勝點
but always
day one.
下一個 AI 的競爭,不在誰的大腦比較強,
而在誰的記憶系統比較好。
每次都是「初次見面」。
LLM 本質上是個「輸入進去、輸出出來」的純函數。它不記得你昨天說過什麼、不知道你公司做什麼、不會記得它上週幫你做過的事——所有的「記得」都是你每次都重新塞回去給它的。
這就讓 agent 在企業場景裡碰到天花板:客服永遠不認得熟客、開發 agent 每次都要重新理解 codebase、行銷 agent 永遠抓不到品牌語感。
⚠ 四個 stateless 衍生的失能
-
①
無法記住過去決策上一輪選了 A 方案、為什麼選 A,下一輪都是空白——同樣的 trade-off 反覆爭論。
-
②
無法延續長任務超過 context window 的工作就會斷頭。「上週做到哪裡了?」沒人答得出來。
-
③
無法建立使用者理解不知道你的角色、口頭禪、偏好的回答長度——個人化只能靠你每次自己提醒。
-
④
無法從錯誤中學習同樣的 bug 修一萬次。沒記錄、沒因果、沒回饋環,無法「越用越強」。
Retrieval
給定一個 query,從文件庫裡找出最相關的片段塞進 prompt。本質是「跑去翻書、把書頁抄一段給 LLM」。每次查詢獨立、不留痕跡。
State + Experience
記得「我們之前做過什麼、結果怎樣、學到什麼」——是跨呼叫的狀態與經驗累積。會更新、會遺忘、會影響未來決策。
沒有狀態
不知道任務做到哪一步、上一輪結論是什麼、下一步該銜接什麼。
沒有時間概念
查到的文件可能是兩年前的舊版——RAG 不知道哪份才是「最新的決策」。
沒有人格 / 偏好
不知道這個公司、這個使用者的風格、偏好回答長度、語氣禁忌。
不會學習
查完資料就結束,這次的回答好或壞,不會影響下次怎麼查、怎麼答。
Graph Memory
Memory 不再是 chunk 的集合,而是「關係網路」。Entity 之間有連結、支援 multi-hop reasoning,更接近人類知識結構。
Memory OS
把 memory 當作一個系統設計:storage / retrieval / update / generation 四個 primitive。不再只是 vector DB,而是一整層 infra。
Memory = Learning
最關鍵轉變:memory 本身就是 learning 機制——記錄行為、記錄結果、建立因果、影響未來決策。Agent 才會「越用越強」。
Memory Benchmark
長期記憶能力、retrieval 準確度、forgetting 機制、跨任務推理——memory 已成為可量化的能力,不再是「我覺得有用」的玄學。
Raw data v.s. Structured insight
記原始對話資料量會爆炸、檢索效率差;只記結論又怕抽象過度、丟失細節。哪些 conversation 該成為長期記憶、哪些該過完即忘?目前沒有公認的判定方法。
Content v.s. Pattern
從 raw log 抽出「規則」需要 LLM 介入做二階推理——但誰保證抽象的結論是對的?錯誤的 pattern 一旦寫入 memory 會持續污染未來決策,比「沒記憶」更糟。
Real-time v.s. Batch
即時寫入會讓 memory 充滿噪音、agent 容易自我加強錯誤;batch learning 雖然乾淨,卻失去了「當下校正」的機會。Real-time × batch 的混合策略還在摸索。
Forgetting is a feature
沒有 forgetting,就沒有真正的 learning——錯誤 / 過期 / 雜訊會把 agent 拖進泥沼。但人類自己也說不出記憶該怎麼遺忘,要 agent 做對更難。
Bigger Brain → Better Memory
接下來 AI 的差距,不會只在模型大小或推理能力。 而會在「誰的 memory system 設計得比較好」——因為 memory 直接決定了: 能不能長期做任務、能不能個人化、能不能持續優化、能不能建立 user relationship。 RAG 讓 AI 可以查資料;memory 才讓 AI 能累積經驗、形成判斷、真正進化。 下一個十年,誰先把 working / episodic / semantic / procedural 四層全部接起來、 再把 update 那道牆解開,誰就握住了 agent 的真正護城河。