Agent时代的数据库长什么样?腾讯云数据库带来新范本!
发布时间:2026-06-02 22:13 浏览量:1
面向Agent应用、AI编程、智能运维场景,腾讯云数据库完成了全栈升级!
5月29日,上海,腾讯云数据库这场围绕AI原生的产品发布会,已经不再是“数据库+AI”的简单拼接,而是一种全新的范式重构。3.0时代的数据库,一改40多年前那个“老哥”形象,开始实现从服务“人”到“Agent”的跨越。
会议期间,腾讯云数据库一口气亮出了多款产品,包括:Agent Memory、TDSQL Boundless、TDSQL-C双引擎、DatabaseClaw等。看得出来,在应对Agentic AI从概念走向大规模化落地这件事上,腾讯云数据库已经做足准备。产品能力除了实测数据验证:慢SQL时延下降六成,长任务Token成本最高节省60%,1TB数据克隆从小时级压到秒级……还在腾讯内部广泛推广,相关能力已经在腾讯元宝、QClaw、Claw Pro 等 AI产品中规模应用,并陆续向行业客户开放。
回望数据库的发展,从1.0时代承接互联网洪峰,到2.0时代扛起国产化自主可控大旗,再到今天3.0时代AI原生数据库的真正到来,数据库发挥的作用,被每个时代赋予了特殊的使命。发布会现场,CCF会士、数据库专委主任周傲英教授在开场时说的一句话,被诸多嘉宾反复引用,他说:“数据是电,以前我们做数据库,就像做发电机;现在,我们要做电网。”
如何理解?今天的数据库,不是简单的“+AI”,不是喊口号,更不是盲目追随;而是从根本上,让AI去赋能数据库,同时让数据库更好地去支撑AI,实现从被动管理到主动执行的全新升级。所以,从整个市场竞争格局来看,在Agent大爆发时代,数据库的对手不再是曾经的那个“友商”,而是为 “人”设计的那个假设的框架,一旦这个框架被推翻,一切就要重新“落子”。
很明显,在这个时间点,在All in Agent大背景下,一场无声的变革已然开启。面对全新的未来,腾讯云数据库“这盘棋”要怎么下?不难猜测,以Agent为第一用户,在底层架构和逻辑上进行重构,应该是所有战略蓝图的第一步。
给智能体装上“大脑”,Agent Memory解决长短记忆问题
当数据库跑完一场又一场的接力赛,3.0时代的命题被AI撕开了一道口子。下一步,Agent需要数据库做什么?我们可能会想到很多关键词,比如:记忆、向量化、多模态、服务状态的持久化等等!
在腾讯云副总裁王义成看来,这个时代真正需要的,是以多模存储和语义检索为原生能力,同时保留SQL、高可用、高性能这些经过验证的产品强项,重新构建一套产品体系。它要以更开放的方式暴露数据,让AI原生状态下的其他工具可以轻松访问,让所有应用的开发模式都变得简单。
在全新的开发模式下,传统数据库的设计显得笨重,跟不上节奏。因为,Agent需要的诸多能力散落在不同产品里,用户得自己找积木、自己拼,应用像“八爪鱼”一样四处抓取数据,不仅割裂,而且痛苦。
换句话来说,Agent 要真正成为生产力单元,需要围绕AI原生进行范式重构。
其中,Agent在生产环境中遭遇的第一个挑战是:当大模型与人类对话,往往聊着聊着就“失忆”了。根本原因与长短记忆有关,也就是Agent Memory。
腾讯云这次推出的 Agent Memory,可以理解为是给智能体装上了三层 “大脑”:
第一层:短期记忆压缩。Agent在长任务执行中会产生海量上下文,如果全部暴力带入,Token的成本会像火箭一样飙升。腾讯云独创了符号化压缩和上下文的卸载能力,在长任务场景下帮助Agent提升30%任务成功率,同时最高可节省60%的Token成本。
第二层:长期记忆沉淀。Agent要真正理解用户和业务,需要记住用户的偏好、业务的规则以及历史角色,还有一些之前执行的经验。通过四层渐进式记忆提取的方案,可以显著提升数据库在OpenClaw的长期记忆能力。
第三层:团队记忆组织化。这是业内首个将“团队上下文”共享给多Agent的概念。所谓“团队记忆组织化”,是指将一个企业组织的目标、流程、客户信息和工作偏好,形成一个可供多Agent复用的共享记忆体。这也是AI时代从个人工具转向系统组织时,必须要补上的一个数据库层的关键基础设施。
值得一提的是,在长期记忆中,业界通常关注在怎么更好的找到记忆,而腾讯云的做法不仅仅关注到召回记忆,同时也更关注记忆的组织,腾讯云数据库的做法是:
• L0:用户原始对话,拥有完整的Session记录;
• L1:原子记忆,从原始对话中抽取的最小记忆单元;
• L2:场景记忆,把原子记忆按场景聚类;
• L3:个性化画像,把一些核心洞察放在里面。
通过这四层架构,使得个性化记忆比原生的OpenClaw有较大提升,同时腾讯云数据库也支持把长期记忆沉淀为Skills。腾讯云数据库副总经理罗云的观点是:长期记忆不只给人用,也可以面向团队,给分布式的Agent用,这是一个比较有发展前景的设计。
另外,很多企业相关记忆的引擎会消耗一些主模型的Token,用智能化更高的模型做记忆的抽取、记忆的分层,甚至是记忆的召回。事实上,如果你用大尺寸模型去完成一个小型任务,对生产效率的提升带来的是负面效果。所以腾讯云数据库内部,自研了记忆场景下的垂类模型。
除了分层概念和最终的驱动模型之外,记忆的存储设计采用的是Harness中立原则,面向多Harness都可以快速接入这一套记忆方案。目前,Agent Memory整体代码已经开源到社区,不到2周时间就达到了5K+Stars。当然,为了简化用户在云上的使用成本,腾讯云数据库也会提供一站式云上托管方案,让客户通过插件方式在云上快速运行。
不过,记忆只是冰山一角。只有当Agent能持续理解组织工作的时候,它才能真正从工作效率工具蜕变为组织成员。而在智能体落地过程中,更大的挑战来自于海量散落的多模态数据。
多模融合,TDSQL Boundless重塑Agent数据底座
如果说 Agent Memory 解决的是Agent的多层“记忆”问题,那么 TDSQL Boundless 要解决的是更底层的“长期知识中枢”问题。
今天,企业数据现状是什么?结构化数据在MySQL、PG 里,半结构化或者低延迟数据放在Redis、MongoDB里,结构化的大文件、图片、视频放在类似于COS 的对象存储里……一个 Agent 想拿一份完整的新鲜数据,需要穿越三套系统,适配三种不同的延迟和一致性协议。
王义成还原了一个令人啼笑皆非的事实:“Agent花了 80% 的时间找数据,只剩 20% 的时间真正用数据。”
TDSQL Boundless 的做法是“分久必合”,通过三大能力支柱构建统一底座:
首先,通过数据联邦的方式,一键纳管 MySQL、PG、Mongo、Redis、COS 等异构数据源,让数据活着长在底座上。用户可以基于内部CDC实时的同步链路做实时汇聚,让数据的新鲜度从天级压缩到秒级,同时支持模态的转换,把文本、图片、音视频直接在库内做跨模态的对齐。
其次,在多模融合之后,多模计算紧随其后。这一层赋予了Agent超强的混合查询能力。它可以在一次查询中同时调动四种智能手段,包括向量搜索、全文检索、图计算和标量分析,可以做到大规模数据的毫秒级响应,关键词的精排,跨关系的推理,自动构建实时图谱等,完美贴合了AI场景下的复杂查询需求,这是目前任何一个单一数据库都难达到的水平。
其三,最为颠覆的一步是“库内推理“。过去传统方案依赖ETL流水线式管道,数据还没用上就先耗尽了精力。TDSQL Boundless直接将AI Function能力嵌入数据库内核,支持LLM直接调用。用户用一行SQL就能调用底层大模型生成数据集,数据写入时自动完成向量化,算力真正下沉到数据层而非把数据拉到算力层。让数据的迁移和加载耗时直降,RAG(检索增强生成)的召回质量提升30%以上。
面向下一代数据库,腾讯云数据库的设计逻辑是:不能在老架构上缝缝补补,必须原生构建,打造多模态、按需弹性、开放、不锁定的企业级数据存储底座。
用腾讯云分布式数据库研发负责人唐彦的话来说,TDSQL Boundless不是一个更大的数据库集群,而是运行在对象存储和开放格式上的具有Serverless 特征的AI多模数据库。也就是说,面向Agent场景的数据库,既要保持传统数据库的一致性体验,又具备开放性和弹性。
在架构设计上,TDSQL Boundless有4个核心能力:
1、对应用全透明的集中分布式一体化的架构,无论是中小型用户,还是大型用户,完全不用关心分库分表以及数据的分布和调度问题。
2、有着近乎无限的计算和存储横向扩容能力,多节点可读写的架构可以轻松驾驭千万级的QPS,而自研的高压缩比的存储引擎则为海量数据存储提供了极致性价比的解决方案。
3、一个真正以Zero-ETL的方式原生提供TP、AP和KV三种类型引擎能力的产品,真正让用户做到在同一个产品入口可以一站式解决三种不同类型场景的需求。
4、具备高度自适应的数据负载均衡调度能力,以及成熟的云原生容器化资源管理,为用户提供了极致的云原生弹性体验以及零运维能力。
如前所述,AI时代多模数据天然规模大、增长快,冷热周期分明,TDSQL Boundless以对象存储作为多模数据的长期主存储。数据经过计算引擎直接会沉淀到COS/S3的存储介质上,计算引擎则会做一些按需读取、换算、预热加速等优化,这样做的核心收益是,整个集群的成本模型从容量驱动变成了按需计算的驱动,在解决了存储成本的同时,对象存储的访问路径和读写模式天然开放和标准,为下一步决策奠定坚实的基础。
另外,TDSQL Boundless还将优先兼容 Iceberg、Parquet、Lance 等开放数据格式。同一份数据,同时服务 BI 分析、AI 训练、RAG 检索、数据治理等场景,用户不再需要为每个消费方各维护一条通道。
AI时代的数据还有一个显著变化,负载波动变化大,比如:白天是RAG搜索高峰,晚上批量用户会做Embedding和搜索构建的动作,平时长尾低频,偶尔新数据导入又引发计算暴增。这时,具备Serverless架构+负载感知的按需弹性能力,就变得非常重要。在设计上,TDSQL Boundless把计算资源完全池化,各种计算引擎完全独立,像SQL查询、向量检索、全文检索池、索引构建池会各自独立,在空闲的时候自动缩容,高峰的时候自动扩展,在线查询和批处理互不干扰,让AI用户、AI场景只为真实发生的需求和使用而买单。
TDSQL-C双引擎带来Agent开发与应用的一体化
满足了AI Agent对基础架构的需求之后,下一步的问题是Agent最终用户如何基于云原生底座协同开发?测试、投产、生产全链路,数据库又该怎么变?
“腾讯内部的很多应用都有AI原生开发团队的筑底,跟着CodeBuddy、元宝一路跑下来后发现,传统数据库给AI用很难适应。”王义成举了一个真实例子,Vibe Coding工具一句话生成应用,背后是百万级长尾效应。按月收费很难适配这种应用方式,包括Agent多步骤任务、存档等,传统备份恢复模式也跟不上节奏。如果把RAG知识库上亿条记忆直接放到内存里,一下就被打爆了。不是数据库不好,是它压根不是为这个时代设计的。
针对上述痛点,腾讯云数据库对TDSQL云原生版本——TDSQL-C做了一次系统性的升级,TDSQL-C 2.0架构目标很明确:做一款真正面向AI时代的双引擎云数据库。TDSQL-C既支持MySQL ,也原生支持PG,同时可以一站式对接腾讯云Cloudbase,Cursor、FastGPT这类AI开发应用都能打通,MCP和REST协议统一接入。
大体来看,TDSQL-C封装了几个关键能力:
1、Serverless,长尾场景的正解。针对Agent频繁调用特性,TDSQL-C用云原生技术把实例创建从分钟级压到秒级。闲置不计费,有调用毫秒级冷启动,扩缩容亚秒级完成。不管Agent怎么折腾,资源跟着走。
2、Branch,为实验和回滚而生。传统数据库克隆1TB数据是小时级。为了实现秒级响应,TDSQL-C把时间点回放从备份恢复变成快照毫秒级,对主库零干扰。Agent跑流水线、跑测试,每次都能拿到一套跟线上完全一致、但完全隔离的沙箱环境,这才是Agent时代该有的开发体验。
3、AI Toolkit,实现一库直达目标,不用东拼西凑。Agentic时代,开发者需要一些比较实用的工具箱,基于腾讯AI原生算子能力,可以实现亿级向量零损耗召回;列存实时分析,整体提速10倍;向量检索内存降低75%。使得RAG、长期记忆、实时洞察等复杂的AI需求,在TDSQL-C上一库直达。
4、AI Native Storage,构建了新一代极致弹性、极致性价比的存储底座。前面讲的Serverless、Branch、AI Toolkit等这些能力,传统存储底座根本撑不住,闲时的归零依赖于极致的弹性,秒级的扩容依赖于快招的分插,混合的负载依赖一份数据多份引擎,这些都只能从存储层面做根本性的重构和重新的研发。
面对智能体爆发、降本增效等挑战,TDSQL-C 2.0的新存储架构,从性能、成本、容灾和数据安全等层面逐一击破。腾讯云云原生数据库研发负责人李志阳,在关键技术能力创新上进行了详细分享。其中,在性能上,采用日志数据分离架构,在原来架构基础上引入了一个专用的高性能的日志存储系统logstore,通过简化写链路让性能零损耗;成本上,通过冗余空间的复用和高效的增量数据搬迁,整个存储成本下降20%-40%;容灾能力上,通过灵活的副本放置能力实现跨园区副本;数据安全上,引入本地备份,将快照数据长时间存储在存储池里面,保证用户不修改数据也不会占用任何空间,做数据修改只需要恢复元数据就可以实现秒级的恢复。
数据库智能体诞生,DatabaseClaw成为新一代“AI数据库员工”
如果说前面的产品和数据底座是为了“服务好AI”,那么腾讯云这次推出的杀手锏DatabaseClaw,则彻底让数据库变得“疯狂”了。
“我们看到的今天行业的一个通病,就是大量的慢SQL导致DBA加班加点去处理。” 王义成直言,DBA不再应该是“救火队员”,DatabaseClaw正把自己塑造成一个超级个体,将运维从“被动响应”推向了“主动免疫”的更高阶段。
DatabaseClaw的发布,让人对数据库+AI的未来充满想象空间,这是一个让数据库“自己给自己看病”的AI Agent,核心功能是基于OpenClaw框架,让DBA用自然语言完成跨控制台的排障任务。
DatabaseClaw有很多杀手锏级能力,令人感到惊艳。比如:工单经验转化。其内置的专家诊断能力,沉淀了腾讯云十万级DBA工单实战经验,汇聚了数百甚至上千名顶级DBA的故障排查SOP(标准作业程序),能够调用源码级的知识库,甚至预判故障。
另外,DatabaseClaw的安全性和可观测能力达到了企业级生产环境要求。全链路审计和四层隔离机制让AI的每一步操作都有据可查。
DatabaseClaw还有着更强大的推理和决策能力,让数据库在系统初步感知到性能抖动时,不用等待运维干预,Agent主动决策,执行分流或读写操作。
写在最后
不管是Agent Memory 、Boundless、TDSQL-C双引擎,还是DatabaseClaw,这些产品的发布,其实在传递同一个信号:数据库正在发生新的进化,它除了是存储数据的仓库,还可以是Agent 开发时的运行环境,是 AI 应用的智能底座。
至于,数据库+AI的未来到底长什么样?或许没人能给出最终答案!但有一点可以确定:未来的数据库不只服务于人,还将服务于Agent,与AI原生共存和并行。从这个角度来看,这场发布会不只是产品层面的能力跃迁,更具有划时代的意义!