资讯 › insight

生产级Agent记忆架构

来源：个人 ·

记忆架构

摘要：三大核心命题：

常规方案的不足：仅用“向量数据库+RAG”的玩具级架构，在精确查找（如查询手机号）和时间状态管理（如用户地址变更）场景存在天然劣势，会导致Agent使用过期信息做决策，出现线上bug。生产级记忆系统：是一套包含分层设计、显式读写策略、时间状态管理和程序性经验沉淀的完整系统。分层设计：分为四层，会话元数据（用完即弃）、结构化用户档案卡（JSON格式存储用户偏好等，精准键值查找）、近期对话摘要（浓缩主题关键词，压缩Token）、滑动窗口（处理当下对话上下文，超出Token上限丢弃最老信息）。三大核心命题： Memory是影响决策的外部状态，而非静态日志仓库。构建Ledger（原始账本，只追加不修改，保证数据可溯源）、Views（派生视图，转换数据格式供大模型理解）、Policy（控制读写和遗忘策略，在隐私合规场景重要）三件套系统。建立显式慢思考回路，让Agent主动调用记忆工具，而非被动塞进所有历史信息。关键挑战与解法：时间约束：用双时间机制（Valid Time记录信息现实有效时段，Transaction Time记录信息写入系统时间）解决时间状态盲区。程序性记忆：将Agent多次成功完成任务的交互轨迹固化为可复用的Skill技能，转化为标准业务流程（SOP），让Agent越用越聪明。面试高分回答逻辑：先说明向量数据库+RAG是基础，指出其在精确查找和时间状态上的局限；再阐述四层分层架构及各层读写策略；最后补充用Ledger+Views+Policy三件套管理状态，通过双时间机制解决时间盲区，将高频成功路径固化为程序性技能。

生产级Agent记忆架构

相关文章

大厂AI产品PRD 独有8大模块

AI数字人评标技术方案

乱装skills，OpenClaw会更难用！9个必备底座工具，装上才算真能用

多Agent（智能体）如何合理分工