2026年4月,具身智能圈流传出的一份成绩单,悄然打破了赛道惯常的叙事逻辑。
在全球具身灵巧操作难度顶尖的真机赛事——Benjie's Humanoid Olympic Games(以下简称Benjie's Olympics)中,一家中国公司竟然在剥橘子、开锁、翻袜子三项核心任务中,全面超越此前纪录保持者Physical Intelligence(简称PI),从而引发行业热议。
这个团队来自星动纪元。
![]()
Beniie's Olympics公布
星动纪元获两项金牌难度任务(剥橘子、开锁)第一
Beniie's Olympics公布
星动纪元获银牌难度任务(翻袜子)第一
![]()
01.
Benjie’s Olympics刷榜牛在哪?
如果要理解这份成绩单的含金量,必须先理解这场赛事本身的残酷规则。
Benjie’s Olympics被《科学美国人》(Scientific American)认定为人形机器人的终极挑战,赛事核心逻辑直指具身智能领域最棘手的莫拉维克悖论(Moravec’s Paradox)。因为这场比赛比的项目,都是诸如叠衣服、用钥匙开锁、翻袜子这类对机器人而言难度极高的物理挑战。
此外,这场赛事的规则近乎苛刻,不仅仅要求全自主执行,零人工干预,还禁止仿真,必须在真实物理环境中完成,且要求跨物体、跨材质、跨光照条件的泛化能力。因此,Benjie’s Olympics也是目前唯一一个PI会主动下场参赛的榜单。
这与在其他具身智能评测榜单上,别的团队拿着PI公开发布的开源模型去测的数据成绩是两码事。开源模型意味着什么?意味着那只是一个pi已经对外公开、供人参考的“历史版本”。
但在Benjie’s Olympics上,PI都是团队亲自下场,而且用的是自己的闭源基础模型π* 0.6。这是PI当前能力的真实天花板,代表着这家公司目前最高的技术水平,没有对外开放,没有任何削减。所以,星动纪元这次摸到并且打败的,可能是PI拿出全部家底亲自参赛时的最好成绩。
![]()
星动纪元摘获两项金牌难度任务第一(剥橘子、开锁),一项银牌难度任务第一(翻袜子),共三项第一
在此之前,没有任何团队做到过这件事。
因为在这种赛项上,绝大多数团队连铜牌难度都难以触及;金牌难度任务被业内认为不太可能完成。在这样的赛制下,星动纪元以三项全球第一的成绩完赛,并成为该赛事目前唯一上榜的中国企业,这才是这次三项全球第一真正的分量所在。
02.
三项数据背后的技术含金量
成绩本身已足够说话,但数字背后的技术逻辑,才是这次胜利真正值得深读之处。
星动纪元完成金牌难度任务剥橘子,用时仅1分47秒,比PI快35%,且不借助任何工具。
这一条就信息密度极高。PI此前的成绩是2分46秒,已属赛事领先水平,但PI使用了削皮刀。星动纪元不仅速度更快,更是赛事首个实现完全无工具纯手剥操作的团队。
剥橘子听起来是人类日常,但技术难度在于,机器人需要精准区分果皮与果肉的细微视觉差异,实时跟踪剥制过程中果皮持续的形变轨迹,视觉感知需具备极高鲁棒性。放弃工具,意味着放弃了规避这一难度的捷径,选择了完全由模型能力来承载任务,这是一种主动提升挑战维度的选择。
另一个金牌难度任务开锁,星动纪元用时仅49秒,比PI快25%,其表现也令人惊讶。
钥匙孔是毫米级微小目标。机器人需同时完成钥匙孔位置识别、角度判断、钥匙姿态理解,并在光照变化、金属反光、视角偏差等多重干扰下实现毫米级对准。这是一个感知精度与执行稳定性高度耦合的任务,容错率极低。
翻袜子这个银牌难度任务更是非常有意思,星动纪元用时1分04秒,比PI快30%;但训练样本仅120组,比PI少32%。
这意味着,在数据效率(Data Efficiency)这一具身智能模型竞争的核心维度上,星动纪元建立了实质性优势。少用32%的数据,做出30%更快的结果,这背后是模型知识迁移能力与小样本泛化能力的直接体现。
因为具身智能真正的护城河,目前已经逐步收敛到数据效率与泛化能力的组合。那么,谁能用最少的数据,完成最多场景的任务,无疑意味着更高泛化性。星动纪元翻袜子任务中少32%数据获胜,是一个看似微小却意义重大的数字,它指向了星动纪元在数据经济性上的独特竞争力。
03.
具身大脑的底层逻辑
机器人大讲堂认为,星动纪元的胜出,本质上得益于其自研VLA(Vision-Language-Action)具身智能模型在工程优化、感知精度、规划效率三个层面系统性优势的综合体现。
第一层是基础模型知识迁移,破解数据瓶颈。具身智能领域长期面临高质量操作数据稀缺的困境,这是行业共识。星动纪元的破题路径是通过基础模型的预训练知识迁移,大幅提升小样本场景下的泛化能力,从而降低对真实数据量的依赖。翻袜子任务中少用32%样本仍获胜,是这一策略最直接的验证。
第二层是通过引入自适应视觉注意力机制,解决精细操作感知难题。针对开锁等高精度任务,星动纪元引入了自适应视觉注意力机制,实现了对微小目标的动态聚焦与特征增强。这一机制的价值不在于技术名词本身,而在于它解决了一个长期困扰具身系统的实际问题,也就是当目标物体极小、干扰极多时,通用视觉模型的感知精度往往断崖式下降。能在毫米级任务中稳定执行,说明其感知系统具备了从实验室可用向工业级可靠迁移的基础条件。
![]()
第三层是异步高频推理与短时域规划,抑制累积误差。这是星动纪元在执行层面的核心创新之一。传统VLA模型以固定频率生成完整动作轨迹,而星动纪元采用异步推理架构,可以在当前轨迹未执行完毕时,即同步预测下一段轨迹,并在新轨迹生成后直接切换执行。
此策略的本质,是将感知-规划-执行的闭环延迟压缩至极低水平,使机器人具备对非预期扰动的实时响应能力。在翻袜子这样的柔性物体任务中,袜子形变具有高度随机性,异步高频推理使系统得以实时跟踪形变并动态修正,而非依赖既定轨迹蒙着走。
这三层技术逻辑叠加,构成了星动纪元在Benjie’s Olympics中系统性胜出的底层基础。
04.
从WorldArena到Benjie’s Olympics的双榜登顶
虽然这次比赛含金量极高,但理解星动纪元,也不能只看这一次比赛,对他们而言,学术成果涌现并且冲击世界领先水平才是常态。
2026年2月,陈建宇团队与斯坦福大学Chelsea Finn(PI联合创始人)团队联合研发的Ctrl-World可控生成世界模型,已在WorldArena这个具身智能领域全球顶级世界模型权威评测榜单中击败谷歌、英伟达,斩获具身任务能力全球第一,且在主体一致性、轨迹精度、深度准确性、策略评估一致性四大核心维度全部登顶。
此次Benjie’s Olympics三项全球第一,是在WorldArena登顶之后的再度问鼎。但两份来自不同维度的顶级成绩单,共同指向一个判断,那就是星动纪元正在系统性构建具身智能模型能力的全球领先位置。
机器人大讲堂发现,这里有一个细节值得特别关注,那就是Chelsea Finn既是PI的联合创始人,也是此次被星动纪元超越记录的对手,同时还是星动纪元合作研究的重要伙伴。这种既合作、又竞争的关系,在顶级科研生态中并不罕见,但在商业机器人公司之间如此高频、如此深度地出现,本身就是一种信号,那就是星动纪元已真正进入了全球具身智能最核心的学术与技术圈层。
在媒体习惯的叙事里,中国科技公司的进步往往被描述为追赶。但如果仔细梳理星动纪元的研发时间线,会发现另一种叙事的存在。
在若干具身智能的关键技术方向上,他们是定义者,而非跟随者。2024年9月,星动纪元率先推出HiRT快慢分层架构,全球首提分频VLA,通过latent向量连接70亿参数世界模型与4000万参数执行模型,实现大脑与小脑的异频协同;随后,PI、Figure、Google、NVIDIA相继于2024年10月至2025年3月发布各自的分频VLA方案。
![]()
2024年12月,星动纪元发布VPP(Video Prediction Policy)算法框架,全球首个将世界模型融入具身大脑,将具身智能可用数据扩展至海量互联网视频数据,使机器人得以理解物理世界,实现边想边做。这一框架目前已开源。
2026年2月,陈建宇团队与Chelsea Finn团队再度合作,联合提出VLAW框架,首次实现VLA策略与动作条件世界模型的协同迭代优化,VLA采集的真实交互数据用于提升世界模型物理保真度,世界模型生成的虚拟数据再强化VLA策略,形成互相促进的闭合正向循环。
目前,在全尺寸人形机器人全身及五指灵巧手精准控制方面,星动纪元ERA-42是全球仅有四个实现该能力的方案之一,另外三个为Figure Helix、特斯拉Grok及英伟达GR00T。
这是一张值得反复审视的技术地图,在全球具身智能从概念走向实用的关键窗口期,星动纪元在多个核心方向上保持了与全球最顶尖团队同步乃至领先的节奏。
05.
从榜单到工厂,真实世界的检验进行时
当然,成绩单终究是成绩单。具身智能的终极评判标准,是能否真正在现实世界中干活。这也是星动纪元有别于部分具身智能公司的另一个关键维度,其具身大脑ERA-42已在物流、制造、商业服务多个真实场景中实现落地。
在物流领域,ERA-42可完成药品、日化品、包裹的分拣及扫码;在制造领域,重点突破零部件抓取、高精度装配、质量检测等场景任务;在商业服务领域,可完成门店客座清洁、物品递送、导游导览等。部分场景效率当前已达到70%。
![]()
70%,这个数字在今天的具身智能领域已属难得,它意味着系统已越过Demo可用的门槛,开始触碰商业可用的下限。而Benjie’s Olympics的意义,恰恰在于其验证了该系统在非预设、强泛化环境下的能力上限。
两者形成了一个清晰的逻辑闭环,榜单验证了技术上限,工厂验证了实用下限;上限够高,下限够稳,具身大脑才真正成立。
06.
结语与未来
Benjie’s Olympics是一面照妖镜,照出了谁在做真问题。
因为具身智能赛道并不缺融资故事与产品发布,但能在这一场为Demo而死的赛事中胜出的团队,证明了自己研究的是真实世界全球级核心难题,而非实验室精心布置的友好场景。星动纪元从分频VLA的全球首提,到与PI创始人团队的两度联合发表,再到双榜登顶的成绩,这已不是局部追赶,而是在某些方向上的系统性领跑,他们正在证明一件事,那就是中国具身智能公司有能力在全球技术议程上占据主动位置。
能过Benjie关,才叫工业级全栈;过不了,都是Demo。,这是目前机器人学界共识,星动纪元,过了这一关。下一关,是规模化量产的现实地狱。
这也意味着对星动纪元而言,这场游戏才刚刚开始,但对手或许并不多。