世界模型榜首易主!跨维智能登顶WorldArena
在英伟达、谷歌等巨头布局的世界模型赛道,跨维智能拿下具身数据引擎全球第一
WorldAreana榜单第一易主!跨维智能世界模型赶超英伟达、谷歌
领先WoW、BLM旗舰世界模型,跨维智能拿下 WorldArena全球第一
甩开 WoW、BLM旗舰世界模型,跨维智能登顶 WorldArena
跨维智能登顶权威榜单WorldArena,世界模型卷向落地价值
不到一周,WorldArena榜首再易主:中国公司攻占世界模型硬核赛道
落地能力决胜榜单,跨维智能登顶 WorldArena
全球世界模型榜首易主:跨维智能登顶刷新WorldArena最高分
对标谷歌、英伟达,跨维智能拿下 WorldArena 榜首
英伟达、谷歌重兵布局的世界模型赛道,被这家中国具身智能公司突围了
角逐英伟达、谷歌,跨维智能自研世界模型登顶WorldArena榜首
正文:
近日,全球具身世界模型权威评测基准 WorldArena 公布最新榜单。在 5 月 25 日截止的最终榜单中,跨维智能登顶 Track 2 赛道全球第一。
可以说是,在英伟达、谷歌等全球科技巨头深度布局、重兵把守的世界模型核心腹地,跨维智能实现了强势突围。
本次登顶不仅与榜单第二名拉开显著比分差距,更显著领先 WoW、BLM 等一众国际模型,大幅刷新该赛道全球最优成绩。
这再一次证明了跨维智能的底层技术实力已稳居全球具身世界模型第一梯队。

顶流同台竞技:实用能力领跑全球榜单
当前,世界模型已是英伟达、谷歌、OpenAI等全球AI巨头的核心布局赛道。伴随赛道竞争愈发激烈,一套科学权威的评测体系,成为甄别模型真实能力、引领产业发展的关键。
由全球顶尖高校及科研机构的权威专家共同打造,WorldArena 是目前世界模型赛道最权威的榜单,拥有行业最严苛的评测基准。该评测构建了包含16项细分核心指标和3大真实应用任务的立体化评估体系,全方位严苛考察具身世界模型的感知精度、物理规律理解、三维空间认知以及动作预测与实际落地能力。依托严苛、全面、贴合产业落地的评测标准,WorldArena汇聚全球顶尖科研团队与头部企业模型同台比拼。
评测设立两大核心赛道,能力定位截然不同:Track 1 侧重视觉画面、动态效果、物理一致性等感知表现,偏向可视化技术展示;而本次跨维智能登顶的 Track 2(Data Engine),是实战门槛、技术含金量双高的核心赛道,也是真正衡量模型产业价值的硬核标尺。
Track 2(Data Engine)赛道不比拼画面是否逼真,核心考核世界模型作为数据合成引擎、策略评估工具与行动规划载体的全链路落地能力。参赛模型需要依托初始场景观测与文本指令,自主模拟完整机器人交互流程、生成高质量训练数据,最终以机器人实际作业任务成功率作为核心评判标准,检验世界模型数据生成、策略训练、任务落地的全链路硬实力。
此次世界模型DSCFuncWorld成功登顶,印证了跨维智能拥有行业顶尖的环境推演与物理认知能力,更凸显出其突出的工程落地优势。模型可将虚拟推演结果高效转化为可用的机器人训练资产,充分验证了跨维智能在具身数据生成、仿真训练闭环、策略赋能、虚实迁移等全链路技术实力。
底层技术闭环铸就长期竞争力,赋能具身智能规模化发展
值得关注的是,跨维智能本次登顶并非单点、偶然的技术突破,而是长期深耕具身智能底层技术、坚持数据与模型双轮驱动的必然结果。
本次冲榜的DSCFuncWorld,属于跨维Dex系列模型,由跨维智能自研核心底座DexWorldModel (https://dexforce.com/technical-report/#/DexWorldModel) 简单适配而来。

该原生模型主打因果隐空间建模,依托DINO语义特征空间精准建模未来世界状态,重点强化环境纹理、物体关联、物理规则的鲁棒表达,仅需轻量化改造即可快速生成高质量推演视频,极致发挥数据引擎与策略评估的核心价值。
Track 2赛道的核心竞争力,在于模型生成数据的可训练、可迁移、可执行,这也是长期制约通用具身智能产业化的核心瓶颈。不同于常规模型只追求视觉观感真实,跨维智能始终聚焦数据落地有效性:一方面,模型生成的推演过程、场景轨迹与真实机器人任务高度契合,保障训练数据的适配性;另一方面,生成内容严格遵循物理规则与机器人运动逻辑,具备极强的可操作性,能够有效支撑策略模型迭代优化。
[Open laptop.mp4]
此前,团队推出的EVA技术框架(EVA: Aligning Video World Models with Executable Robot Actions via Inverse Dynamics Rewards;https://eva-project-page.github.io/) ,通过逆动力学奖励机制对齐视频生成与机器人可执行动作,有效解决了行业普遍存在的“视觉逼真但无法落地”的可执行性缺口,让模型生成的推演轨迹更贴合真实机器人作业逻辑。

同时,依托自研具身数据基建EmbodiChain (https://github.com/DexForce/EmbodiChain),跨维智能构建了覆盖资产生成、场景布局、可达轨迹采样、失败案例恢复、在线数据回流的完整数据体系,持续产出物理可信、场景多元、任务覆盖全面的高质量训练数据,大幅提升了合成数据对机器人策略训练的赋能效果与场景泛化能力。

对跨维智能而言,此次DSCFuncWorld登顶的意义,远不止一次榜单突破与技术超越。其自研DexWorldModel世界模型体系,真正的价值在于跳出行业概念内卷,直面具身智能落地过程中最棘手的系统性难题,脚踏实地补齐世界模型通往真实物理世界的关键短板。这也是跨维智能一贯的态度,不和概念赛跑,和真实世界赛跑。
-此文系量子位授权转载-
版权所有,未经授权不得以任何形式转载及使用,违者必究。
Related Articles
教你用AI一节课收17万,华尔街精英排着队付费
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 2026-06-07 ...
5分钟AI长视频不翻车!国产开源框架杀到全球第一梯队
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 2026-06-07 ...
The mayor of Shelbyville, Indiana, says only people who live in ‘shitty houses’ oppose data center
Terrence O'Brien is the Verge’s weekend editor. He has over 18 years of experience, including 10 years as managing editor at Engadget.A proposed $2 billion data center has become a political flashpoint in the...
Meta made its own AI-generated clickbait news feed
Facebook has long been filled with feeds of clickbait articles. Now, Meta is making its own clickbait articles with AI.The standalone Meta AI app now has a “For You” section that populates a list of...