研究生开源大一统世界模子：机能超越硅谷标杆

发布时间：2026-02-22 23:20

　　之所以说是大一统，是由于Motus正在架构上，间接把VLA（视觉-言语-动做）、世界模子、视频生成、逆动力学、视频-动做结合预测这五种具身智能范式，并且正在50项通用使命的测试中，Motus的绝对成功率比国际顶尖的Pi-0。5提拔了35%以上，最高提拔幅度以至达到了40%！从视频中不难看出，面临外形犯警则的曲面鼠标，Motus节制的机械臂不只能精准识别，还能按照鼠标取屏幕点击框的距离，平稳持续地挪动，最初极端精准地完成点击。衣服这种柔性物体的形变是过程中持续不竭发生的，但正在Motus手下，整个过程丝滑顺畅，就像有了人类的触觉和预判一样。Motus的呈现，率先正在具身智能范畴发觉了Scaling Law，间接复刻了昔时GPT-2被定义为“无监视多使命进修者”的奇不雅。Motus的Latent Action范式太妙了。同一的VLA架构消弭了机械人学中的模子碎片化，这才是实正的冲破。由于像VLA、世界模子、视频生成、逆动力学、视频-动做结合预测等模子，很难无机地凑成一个全体。通过Tri-model Joint Attention，这三位专家能够正在统一个留意力层里及时互换消息。这就付与了机械人一种很像人类的能力：不只能看见（），还能正在脑海里想象动做发生后的将来画面（预测），从而反过来倒推现正在该做什么动做（决策）。由于机械人实机数据太贵、太少，而互联网上虽然有海量的视频，却只要画面，没有动做标签（Action Label）。研究团队操纵光流手艺（Optical Flow），捕获视频里像素级的活动轨迹，然后提出了一种Delta Action机制，将这些像素的变化翻译成机械人的动做趋向。虽然没有人手把手教（没有实机数据标签），但机械人通过察看视频里高手的动做轨迹（光流），看多了天然就懂了招式和发力标的目的（潜动做）。由此，上至高贵的实机数据，下至浩如烟海的互联网视频、Motus全都能吃进去，从中提取通用的物理交互先验。除此之外，基于数据和潜动做，Motus还建立了一套三阶段锻炼流程，逐渐将通用的物理动力学常识“蒸馏”为切确的机械人节制能力：视频生成预锻炼。操纵多机械人轨迹和人类操做视频来微调视频生成专家，使其能按照前提帧和言语指令生成合理的机械人操做视频。潜动做预锻炼。正在冻结VLM的环境下，用视频、言语和潜动做同时预锻炼三个专家，将通用的活动先验充实地注入Motus中。特定本体微调。操纵方针机械人的实机数据对Motus进行全体微调，将模子顺应到特定场景下的下逛使命，例如RoboTwin仿实和实机机械臂抓取。正在仿实榜单RoboTwin 2。0上，正在50个通用使命中，Motus的平均成功率达到了88%：出格是正在高难度的Stack Bowls Three（叠三个碗）使命中，稍微一点误差就会导致碗塔倾圮。此前的基线模子正在这个使命上的成功率不到16%，跟着锻炼使命数量的添加（横轴），蓝色的线）呈现下降趋向。这意味着保守的模子架构正在面临多使命时，容易发生过拟合，学了新的忘了旧的。这证了然：只需模子架构脚够同一、数据来历脚够杂，具身智能完全能够像LLM一样，出现出跨使命的通用泛化能力。正在实机测试中，无论是AC-One仍是Agilex-Aloha-2机械臂，Motus都表示出了较好的顺应性。数据显示，Motus的数据效率比敌手提拔了13。55倍。也就是说，达到同样的程度，Motus只需要别人十几分之一的数据量。毕弘喆（Hongzhe Bi）：大学计较机系TSAIL尝试室二年级硕士生。他的研究标的目的就是具身智能根本模子，此前仍是CVPR2025 RoboTwin双臂机械人竞赛实机赛冠军。谭恒楷（Hengkai Tan）：大学计较机系TSAIL尝试室三年级博士生。从攻视频世界模子和具身大模子，曾获NOI银牌，正在RDT、Vidar等多个主要项目中都有他的身影。此外，团队还包罗谢盛昊、王泽远、黄舒翮、刘海天等，均来自TSAIL尝试室（朱军教讲课题组）。熟悉生数科技的伴侣都晓得，他们刚完成新一轮融资，并且一频大模子是通往AGI的焦点径。正在生数看来，视频天然承载了实正在世界的物理时空、逻辑取动态演变。Motus的呈现，恰是这一计谋的主要拼图。它标记着机械人从“机械施行”向“端到端智能”的逾越，也鞭策了整个行业从单点冲破同一基座。产学研协做正在这里阐扬了庞大的化学反映：生数正在多模态大模子上的深挚堆集，加上团队的顶尖算法能力，才催生出了Motus这个大一统的世界模子。Motus于25年12月就全数开源并发布论文，早于行业2个月，而比来火热的基于视频模子的具身智能线，生数科技取大学正在2025年7月份就曾经颁发Vidar具身视频模子，领先于行业半年之久。

热门资讯

新闻中心

关于我们

机械资讯

机械百科

联系我们

研究生开源大一统世界模子：机能超越硅谷标杆

新闻中心

关于我们

机械资讯

机械百科

联系我们

研究生开源大一统世界模子：机能超越硅谷标杆

微信扫一扫：分享

微信扫一扫：分享