机器人互动如何做好上下文:短期记忆,固化和注入长期记忆:

2025/11/21 14:14:03 2271 
 

上下文管理是对话式 AI 的记忆中枢,需通过技术方案(RAG、结构化记忆)与优化策略 (意图过滤、动态裁剪)解决连贯性、资源消耗与准确性的三角平衡问题。

声网对话式 AI 引擎采用的方案是通过结构化短期记忆+动态长期记忆注入,在保障兼容性的同时,针对实时语音交互场景(尤其中断处理)进行深度优化,并赋予开发者高度灵 活的上下文控制权限。

1.短期记忆机制

短期记忆(Short-term Memory)是智能体在当前会话中临时保存和处理的信息空间。 用户和对话式智能体互动期间,智能体会在短期记忆中缓存当前对话的上下文,确保智能体 能够连贯地理解和回应用户的连续输入。

对话式 AI 引擎整体短期记忆会以 JSON 的形式存储,遵循 OpenAI Chat Completions 的规则,同时进行了部分的扩展。

2.短期记忆的获取:

◇ 智能体运行期间,调用 GET 获取智能体短期记忆接口获取短期记忆 JSON。该接 口会得到智能体生命周期内储存的完整的短期记忆。

◇ 智能体停止后,声网会通过消息通知服务将短期记忆回调至你的业务服务器,详见 消息通知事件类型。

3.固化和注入长期记忆:

智能体的短期记忆会随智能体停止而消失,你可以在智能体停止后,将短期记忆储存到 你的服务器以固化为长期记忆,之后在创建智能体时通过 llm.system_messages 直接注入 原始记忆内容或经过总结的记忆内容,从而实现在智能体退出或重启后仍然能够访问和使用 这些数据。

以下示例展示了通过 system_messages 注入经过总结的记忆内容:



 
上一篇   下一篇
 
返回顶部
  技术支持
  关于创泽
  隐私条款
咨询热线
 
销售咨询
4006-935-088 / 4006-937-088
 
客服热线
4008-128-728

版权所有 @ 创泽智能机器人集团股份有限公司
运营中心 / 北京市·清华科技园九号楼5层
生产中心 / 山东省日照市开发区太原路71