腾讯开源 Agent 记忆技术方案,Token 消耗最高降低 61%
<p>任务成功率最高提升 51%。</p> <p>5月14日,据腾讯云公众号消息,腾讯正式面向全球开源 TencentDB Agent Memory ,针对Agent 长任务场景提供长期和短期记忆压缩能力,支持 OpenClaw、Hermes 等主流 Agent 框架一键部署。在多任务连续 Session 实验中,该方案最高可降低 61% Token 消耗,并将任务成功率最高提升 51%。</p>

当前,Agent 在代码开发、网页搜索、研究分析等场景中的任务链路持续变长,工具调用产生的大量网页内容、代码日志和中间结果,会快速占满上下文窗口导致Token 成本持续上升。
业内当前常见的解决方式,通常是扩大上下文窗口,或对历史内容进行压缩摘要,但在长任务场景下,仍然容易出现上下文膨胀、任务状态混乱等问题。
腾讯云数据库团队开源的TencentDB Agent Memory ,提出了一套新的记忆压缩方案:将完整信息卸载到外部存储,同时保留任务执行过程中的关键状态与结构关系。
其中一项核心能力是“Mermaid 任务画布”。系统会将 Agent 的任务过程组织成结构化任务图,保留任务状态、步骤摘要和执行关系。即使上下文中只保留一张轻量级任务画布,Agent 依然能够快速判断当前任务进度,以及不同步骤之间的依赖关系。
另一项核心能力是“上下文卸载(Context Offloading)”。工具调用完成后,网页内容、日志和中间结果等原始信息不会继续长期占用上下文窗口,而是转移到外部文件系统保存;上下文中仅保留摘要和索引信息,需要时再按需恢复。
根据腾讯云披露的测试数据显示,启用该记忆方案后,Agent 在网页搜索场景中 Token 消耗最高降低 61%、成功率相对提升 52%;代码修复场景中 Token 消耗最高降低 33%、完成率相对提升 10%;复杂长文档场景中 Token 消耗最高降低 31%、准确率相对提升8%。
此外,该项目还包含长期个性化记忆模块,可在Agent跨对话中自动提取用户偏好与历史背景。在 PersonaMem 评测中,该模块将 Agent 对用户画像的理解准确率从 48% 提升至 76%,此前已免费开放服务。
目前,Agent Memory 已在 GitHub 正式开源,支持 OpenClaw、Hermes 等主流 Agent 框架。开发者只需一行命令即可安装使用,无需额外配置数据库或外部服务。Agent 的任务记录、记忆内容等信息,也都会以普通文件形式保存,方便直接查看和调试。
今年以来,腾讯正持续加速 Agent 技术生态布局。上个月,腾讯云开源了 Agent 执行底座 Cube,两周 GitHub Star 数超过 5000。
版权所有,未经授权不得以任何形式转载及使用,违者必究。
Related Articles
Prosecutors used ChatGPT logs as evidence in the Palisades fire trial
Terrence O'Brien is the Verge’s weekend editor. He’s covered the tech industry for over 18 years and knows a thing or two about synths.Jonathan Rinderknecht was facing arson charges for setting a fire on New...
抱抱脸模型TOP榜,我现在只服yuxinlu1
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 2026-06-28 ...
梁文锋署名的DSpark,看懂这10个点就够了!
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 2026-06-28 ...
前端工程师最不想看到的开源项目出现了,一行命令克隆任意网站
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 前端工程师最不想看到的开源项目出现了,一行命令克隆任意网站 ...