生产级Agent记忆架构
来源:个人 ·
记忆架构
摘要:三大核心命题:
常规方案的不足:仅用“向量数据库+RAG”的玩具级架构,在精确查找(如查询手机号)和时间状态管理(如用户地址变更)场景存在天然劣势,会导致Agent使用过期信息做决策,出现线上bug。
生产级记忆系统:是一套包含分层设计、显式读写策略、时间状态管理和程序性经验沉淀的完整系统。
分层设计:分为四层,会话元数据(用完即弃)、结构化用户档案卡(JSON格式存储用户偏好等,精准键值查找)、近期对话摘要(浓缩主题关键词,压缩Token)、滑动窗口(处理当下对话上下文,超出Token上限丢弃最老信息)。
三大核心命题:
Memory是影响决策的外部状态,而非静态日志仓库。
构建Ledger(原始账本,只追加不修改,保证数据可溯源)、Views(派生视图,转换数据格式供大模型理解)、Policy(控制读写和遗忘策略,在隐私合规场景重要)三件套系统。
建立显式慢思考回路,让Agent主动调用记忆工具,而非被动塞进所有历史信息。
关键挑战与解法:
时间约束:用双时间机制(Valid Time记录信息现实有效时段,Transaction Time记录信息写入系统时间)解决时间状态盲区。
程序性记忆:将Agent多次成功完成任务的交互轨迹固化为可复用的Skill技能,转化为标准业务流程(SOP),让Agent越用越聪明。
面试高分回答逻辑:先说明向量数据库+RAG是基础,指出其在精确查找和时间状态上的局限;再阐述四层分层架构及各层读写策略;最后补充用Ledger+Views+Policy三件套管理状态,通过双时间机制解决时间盲区,将高频成功路径固化为程序性技能。