腾讯开源 Agent 记忆技术方案,Token 消耗最高降低 61%
<p>任务成功率最高提升 51%。</p> <p>5月14日,据腾讯云公众号消息,腾讯正式面向全球开源 TencentDB Agent Memory ,针对Agent 长任务场景提供长期和短期记忆压缩能力,支持 OpenClaw、Hermes 等主流 Agent 框架一键部署。在多任务连续 Session 实验中,该方案最高可降低 61% Token 消耗,并将任务成功率最高提升 51%。</p>

当前,Agent 在代码开发、网页搜索、研究分析等场景中的任务链路持续变长,工具调用产生的大量网页内容、代码日志和中间结果,会快速占满上下文窗口导致Token 成本持续上升。
业内当前常见的解决方式,通常是扩大上下文窗口,或对历史内容进行压缩摘要,但在长任务场景下,仍然容易出现上下文膨胀、任务状态混乱等问题。
腾讯云数据库团队开源的TencentDB Agent Memory ,提出了一套新的记忆压缩方案:将完整信息卸载到外部存储,同时保留任务执行过程中的关键状态与结构关系。
其中一项核心能力是“Mermaid 任务画布”。系统会将 Agent 的任务过程组织成结构化任务图,保留任务状态、步骤摘要和执行关系。即使上下文中只保留一张轻量级任务画布,Agent 依然能够快速判断当前任务进度,以及不同步骤之间的依赖关系。
另一项核心能力是“上下文卸载(Context Offloading)”。工具调用完成后,网页内容、日志和中间结果等原始信息不会继续长期占用上下文窗口,而是转移到外部文件系统保存;上下文中仅保留摘要和索引信息,需要时再按需恢复。
根据腾讯云披露的测试数据显示,启用该记忆方案后,Agent 在网页搜索场景中 Token 消耗最高降低 61%、成功率相对提升 52%;代码修复场景中 Token 消耗最高降低 33%、完成率相对提升 10%;复杂长文档场景中 Token 消耗最高降低 31%、准确率相对提升8%。
此外,该项目还包含长期个性化记忆模块,可在Agent跨对话中自动提取用户偏好与历史背景。在 PersonaMem 评测中,该模块将 Agent 对用户画像的理解准确率从 48% 提升至 76%,此前已免费开放服务。
目前,Agent Memory 已在 GitHub 正式开源,支持 OpenClaw、Hermes 等主流 Agent 框架。开发者只需一行命令即可安装使用,无需额外配置数据库或外部服务。Agent 的任务记录、记忆内容等信息,也都会以普通文件形式保存,方便直接查看和调试。
今年以来,腾讯正持续加速 Agent 技术生态布局。上个月,腾讯云开源了 Agent 执行底座 Cube,两周 GitHub Star 数超过 5000。
版权所有,未经授权不得以任何形式转载及使用,违者必究。
Related Articles
重生之我在AI时代当老板:让一群Agent互相PUA
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 2026-05-14 ...
You can make an app for that
AI is empowering a generation of vibe coders to build exactly what they want. The personal software revolution is here.by David PierceMay 14, 2026, 11:00 AM UTCDavid Pierce is editor-at-large and Vergecast...
国产GPU组了个开源局,把SGLang等核心开发者都摇来了!
国产GPU开启生态坐标之争
Robotaxi第一股又涨疯了
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 2026-05-14 ...