滚球app官方网站 > 大小球 >

滚球app下载「具身贤惠操作奥林匹克」大赛三项第一, 全被国内这家公司拿下

2026-04-10 22:14:15 200

滚球app下载「具身贤惠操作奥林匹克」大赛三项第一，全被国内这家公司拿下

机器之心剪辑部

始终以来，咱们依然风俗了机器东说念主行业中那些令东说念主头昏脑眩的视频 Demo：在经过千挑万选的配景下，智能体完成着精确又漂亮的动作。

然而，现实很狞恶。

如若把机器东说念主扔进真实、杂沓且多变的环境中，它们往往会坐窝「原形毕露」，时时大翻车。

机器东说念主：抓不到，即是抓不到。

机器东说念主：炒菜，我是生人。

这些看似简便的任务（举例抓取物体、炒菜），虽对东说念主类来说举手之劳，但关于机器东说念主却是充满了不可预念念的挑战。

当东说念主们在考究 Demo 与拙劣现实的落差中感到无奈时，一家专注于具身智能及通用东说念主形机器东说念主研发的中国公司，在目前全球最硬核的实战赛场上，交出了一份极具劝服力的答卷。

近日，凭借自研 VLA 具身智能模子，星动纪元一举斩获了具身界贤惠操作奥林匹克 Benjie's Humanoid Olympic Games（简称 Benjie's Olympics）三项任务的全球第一。

星动纪元在 Benjie’s Olympics 大赛中斩获的奖牌

Benjie’s Olympics 公布的最新获利显现，星动纪元在翻袜子（银牌难度任务）中获利位列全球第一，并在开锁、剥橘子两项金牌难度任务中同期登顶，三项中枢任务全面刷新寰宇记录。

Benjie's Olympics 公布星动纪元两项金牌难度任务（开锁、剥橘子）第一。

Benjie's Olympics 公布星动纪元银牌难度任务（翻袜子）第一。

要确实和会这三项第一的重量，必须先搞了了一件事：星动纪元打败的，不是一个等闲敌手。

他们打败的是通盘行业公认的本事当先者 Physical Intelligence（简称：PI），PI 拿出了从未公开过的闭源模子 π*0.6。

收尾，全败。

星动纪元也因此成为该赛事迄今为止唯独上榜的中国企业。

要知说念，在全球具身智能规模，PI 的获利大多来自第三方机构调用其开源模子跑出的收尾，但这并非 PI 的真实战力。

Benjie's Olympics 是个例外。这是目前全球唯独一个 PI 官方主动下场、切身参赛并公开打榜的赛事。PI 为此派出的是从未对外通达的中枢闭源模子 π*0.6，不错说是确实真义上的全力出击。

而星动纪元，恰是在这个擂台上，三项一起拿下等一。

绝不夸张的说，这是具身智能行业有史以来，第一次有机构在全力对阵 PI 闭源模子的要求下，达周密面卓著。在此之前，莫得任何一家企业作念到过这件事。

硬核机器东说念主比赛，让 Demo 玩家出局

要和会星动纪元这几项第一的含金量，咱们必须先了解一下 Benjie's Olympics 是一个如何硬核的存在。

如若你在机器东说念主行业待过一段时刻，就会发现一个心照不宣的微妙：大多数发布会上的 Demo，是尽心瞎想的扮演，而非真实智商的呈现。

Benjie's Olympics 的存在，即是为了斥逐这种扮演文化。

该赛事由前谷歌资深机器东说念主大家 Benjie Holson 发起。创立初志惟有一个，即是为了撕下机器东说念主行业的包装，把评判体系从炫技扮演拉回到实用落地的层面上来。

正因如斯，它在业内赶快获取了一个非官方的名称：机器东说念主行业的压力测试。那些花里胡梢的 demo 炫技在这场比赛中将无所遁形。

这场比赛的含金量，不仅体目前赛制自身，更体目前参赛声势上。赛事积存了 PI、Sunday Robotics 等全球顶尖具身智能公司。前边咱们也已提到，这亦然 PI 唯独主动参与的赛事，他们为此额外挪动了其闭源旗舰模子 π*0.6，代表了 PI 大脑智商的最高水准，而非任何保留实力的参赛版块。

换句话说，这场比赛的获利单，顺利反馈了当前具身智能规模的全球最高水平。能在这个擂台上拿第一，意味着什么，不问可知。

赛事共设有 15 项实战挑战，按照难度分为金牌、银牌和铜牌难度任务，开锁和剥橘子属于金牌难度任务，而翻袜子则属于银牌难度任务。在这些任务中，任何轻细的舛错（1–3mm）都可能导致任务失败，极熟识机器东说念主的精确度和知晓性。

关于金牌难度任务，行业内公认简直无法达标，关于银牌难度任务，看似闲居，实则对柔性物体操控智商要求极高。星动纪元恰是在公共公认不可能一起完成的任务上，一起拿到第一。

端正层面的尖刻进程一样超出老例赛事：全面熟识机器东说念主的自主智商温暖应智商。要求全自主、零东说念主工纷扰、无仿真。一朝任务运转，不容任何口头的遥控、东说念主工介入或汉典修正，机器东说念主必须在真实场景中统统自主完成任务。环境和物体立时摆放，不容使用符号或预扫描舆图，确保每个任务都在全新的、不可先见的要求下进行。

这意味着，参赛选手不可靠背题，只可靠真武艺。

正如 Physical Intelligence 团队所评价的：「每个任务都对准具身智能最难的未解问题，柔性物体、高构兵操作、永劫序自主。莫得其他比赛能并排。」

业内大家的共鸣则愈加直白：这是唯独强制泛化而非复现的比赛。多数军队连铜牌都过不了；金牌，近乎遗址。

关于这种规格的比赛，选手们亦然大倒苦水：「咱们花了 6 个月作念 Demo；在 Benjie 任务上 3 天 90% 失败。真实寰宇确凿绝不海涵。」看完这个批驳，确凿合计可笑又心酸。

行业因此形成了一个新的评判圭臬：能过 Benjie 关，才叫工业级全栈；过不了，都是 Demo。

恰是在这么的配景下，星动纪元在开锁、剥橘子、翻袜子三项任务中一起斩获第一。

但这三项获利的真义，不可用等闲比赛的逻辑来和会。

以剥橘子为例，单是这一项任务，就要求机器东说念主同期具备：3D 视觉与触觉的实时和会、LLM 任务谋划与通顺死心的协同颐养、物理学问推理（重力、摩擦、形变预判），以及谬误自修正智商（如物体跌落伍的规复计谋）。任何一个要领的短板，都会导致全盘失败。

这不是某一项本事的当先，而是全栈智商在极点压力下的全体考据。

在一个金牌近乎遗址的比赛中，拿下三项第一，这即是星动纪元交出的答卷。

打败 PI，星动纪元三大中枢任务夺冠

Benjie's Olympics 在获利公告中告示，星动纪元在剥橘子、开锁和翻袜子三大中枢任务中，均以权臣的上风卓著了前记录保持者 PI。

PI 曾是该赛事中首个拿下多个金牌难度任务的顶尖团队。然而，星动纪元这次交出的获利单，不仅是实施时刻的全面裁减，更是在操作样式和模子泛化智商上展现出了特有上风。

剥橘子（金牌难度任务）：首个达成纯手剥，速率比 PI 飙升 35%

剥橘子这类任务，对东说念主类来说至极松驰，但对机器东说念主而言，却是典型的高难度操作。一不防范就会把橘子捏碎，果肉扯破，导致操作失败。

更费事的是，这一进程往往需要双机械臂的协同配合：一只机械手需要知晓固定橘子，死心全体受力，另一只手则需要沿着果皮旯旮进行精采剥离。在剥离进程中，力的大小、标的以及构兵位置都需要不休动态调整，一朝两只手之间的配合出现偏差，就容易形成挤压或扯破。

与此同期，橘子在操作进程中还会不竭发生形变，机器东说念主需要实时感知果皮与果肉之间的轻细变化，并据此调整动作计谋。这使得剥橘子不仅是一个简便的操作任务，而是对视觉感知、力死心、双臂协同以及实时有缱绻智商的抽象熟识。

面临这一极其复杂的柔性操作，前记录保持者 PI 借助削皮刀等外部用具，最终用时 2 分 46 秒完成。而星动纪元则顺利突破了用具的依赖，成为该赛事首个达成统统毋庸具、纯手剥操作的团队。他们仅用时 1 分 47 秒就完成了纯手剥任务，速率比 PI 快了足足 35%。

开锁（金牌难度任务）：克服重深爱觉干扰，速率比 PI 普及 25%

东说念主类开锁往往不错依靠手部的触觉反馈，滚球app但机器东说念主的高精度操作相当依赖视觉前置教学。钥匙开锁手脚典型的精采任务容错率简直为零，金属名义的高光反光还会在机器东说念主的视觉传感器中形成噪点干扰。这就要求 AI 模子不仅要能在一派反光中「抠出」锁孔位置，还要精确解算出钥匙的三维姿态。

在这项牵线搭桥的任务中，PI 的完成时刻为 66 秒。星动纪元则展现出了更强的高构兵操作智商，仅用时 49 秒便班师开锁，将全体操作速率普及了 25%。

翻袜子（银牌难度任务）：试验样本比 PI 少 32%，实施速率快 30%

在机器东说念主死心任务中，抓取硬质零件往往依靠的是三维坐标体系，但这套逻辑在「翻袜子」眼前会顿然失效。手脚一个柔性物体操作场景，它的中枢难点在于无规章形变。在翻转的每一帧，袜子的物理形态都在发生改变。机器东说念主必须实时追踪动态形变，精确分辩出袜子的表里侧和启齿位置。这意味着模子必须确实和会咫尺的这团布料，具备物理规章学问，而不是背诵动作领导。

为了完成这项任务，PI 动用了 176 个样本，耗时 1 分 33 秒。而星动纪元则展现出了极其惊东说念主的小样本学习智商：他们仅使用了 120 个样本（比 PI 大幅减少了 31.8%），不仅见效完成任务，耗时更是裁减至 1 分 04 秒，速率比 PI 普及了 30%。

星动纪元的卓著不啻是单纯的更快，而是其模子在应付复杂任务时展现出的具体上风：纯手剥橘子不依赖外部用具，阐明了模子对柔性物体形变的和会；开锁任务的畅通实施，展现了高精度感知与动作的知晓协同；而用更少的试验样本完成翻袜子，则阐明了其更高效的数据应用率与泛化智商。

这三项任务的抽象阐扬，考据了这套自研具身大脑在真实场景下的本事优胜性。

星动纪元 VLA 模子，凭什么在具身智能顶级博弈中胜出？

在具身智能的演进旅途中，VLA（Vision-Language-Action）模子已成为主流范式。其中枢愿景在于突破视觉感知、言语和会与动作死心之间的壁垒，达成三者的深度表征和会。

尽管 VLA 提供了结伙的架构，但在施行应用中，智能体仍难以应付如「翻袜子」、「开锁」等精采化操作。这类任务的难点不在于简便的领导实施，而在于以下三重智商的复合要求：

高效的知识挪动智商：从海量预试验数据中提真金不怕火通用规章，而非对每个任务从零学起。

动态自顺应感知：在物体形变（如柔性织物）或环境干扰下保持感知知晓。

实时有缱绻闭环：凭证动作反馈即时修正轨迹，确保操作精度。

针对上述痛点，星动纪元 VLA 模子通过底层架构优化，在数据应用、感知精度和死心响应等关键要领上达成了权臣突破。

最先是极高的样本效果，在具身智能商酌中，数据往往是最稀缺的资源。尤其是在触及柔性物体操作的场景中，集结和标注高质料数据老本极高，这也使得模子对数据规模的依赖成为始终瓶颈。

在翻袜子任务上，星动纪元仅使用 120 组试验样本，就达到以至逾越了 PI 使用 176 组样本的阐扬，样本量减少约 32%。这就好比别东说念主背 1000 个单词才略考过，它背 700 个就够了。

其背后的关键在于基础模子的知识挪动智商。通过在大规模预试验阶段学习到的通用视觉与动作规章，模子好像将这些已有教导挪动到具体任务中，从而在一丝样本要求下快速顺应新场景。这种智商，使得模子不再统统依赖针对单一任务的大规模数据堆叠，而是具备了一定进程的跨任务泛化智商。

这种泛化智商在施行应用中至极关键，在现实场景中，许多任务都不具备饱胀的数据维持。如若模子需要依赖多数样本才略阐扬性能，那么其落地老本将极高；而一朝模子具备小样本泛化智商，具身智能才略更好的在现实场景中落地。

其次是自顺应视觉认真力机制，在具身智能任务中，感知智商往往是最容易被低估、却最决定成败的一环。尤其是在开锁这类精采操作中，钥匙孔往往惟有毫米级大小，同期还伴跟着光照变化、金属反光、视角偏差等多重干扰，这些成分都会权臣影响视觉识别的知晓性。一朝感知出现偏差，后续的动作实施简直势必失败。

在这一丝上，星动纪元引入了自顺应视觉认真力机制，使模子好像在复杂环境中动态聚焦关键区域，对钥匙、锁孔等轻细指标进行特征增强。模子不再是平均地看总计信息，而是好像在关键时刻把认真力结伙在最进犯的细节上。

其顺利纳尾是在高干扰环境下模子依然好像保持知晓的指记号别与对皆智商，为毫米级精度的操作提供可靠的感知基础。这类智商，决定了机器东说念主能否从看得见迈向看得准，亦然其在开锁任务中达成更快、更知晓实施的关键成分之一。

临了是异步高频推理与短时域谋划。在具身智能任务中，机器东说念主的反应速率往往顺利决定任务能否见效。然而，现实环境处于动态变化之中：物体的位置会发生偏移、形态会发生改变，一朝动作实施与环境景况脱节，谬误就会快速累积，最终导致任务失败。

但在传统 VLA 模子中，死心计谋往往以固定频率生成一段较长的通顺轨迹（往往逾越 1 秒）。在这段轨迹实施进程中，模子无法凭证环境变化进行实时调整，这意味着一朝出现偏差，只可比及下一次谋划时再修正，导致反应滞后。

针对这一问题，星动纪元引入了异步推理与短时域谋划机制：在当前轨迹尚未实施完成时，就同步谋划下一段轨迹，一朝新轨迹生成，系统便立即切换实施。这么一来，模子的有缱绻频率被权臣普及。

机器东说念主的某个重要先沿着第一段轨迹（Chunk 1）通顺，当到达第二段轨迹（Chunk 2）出现的时刻（图中的竖线位置）时，便切换为沿第二段轨迹赓续通顺；随后再在第三段轨迹（Chunk 3）出刻下进行切换，如斯轮回。开端：https://generalrobots.substack.com/p/robotera-snatches-silver-in-sock

这么一来，机器东说念主好像以更高频率不竭修正动作，对突发扰动（如袜子形态变化）作念出更实时响应，从而灵验防止谬误累积，权臣普及任务的见效劳与全体知晓性。

也恰是在上述模子智商的撑持下，星动纪元的 VLA 具身模子在柔性物体操作、双手合营、用具使用以及长程复杂任务等关键智商上达成了同步普及。

这些智商单拎出来都不荒野，难的是在一套模子里同期跑通、同期知晓。这亦然为什么 Benjie's Olympics 任务极具挑战，而星动纪元却能连拿三项第一的原因。

能在这么的赛场上三项登顶，宣告了星动纪元在管制具身智能中枢难题上，依然摸索出了一套比外洋顶尖同业更灵验的步骤论。

星动纪元凭本事更变，引颈具身大脑全球商酌范式

其实，星动纪元早已在全球具身智能的商酌范式上建造了引颈地位。

本年 2 月，星动纪元创举东说念主陈建宇团队与斯坦福大学 Chelsea Finn 团队（她恰是前记录保持者 PI 的创举东说念主）结伙发布了 Ctrl-World 可控生成寰宇模子。

该模子辞寰宇模子巨擘评测 World Arena 榜单上一举打败谷歌、英伟达等顶尖模子，在主体一致性、轨迹精度、深度准确性、计谋评估一致性四大中枢维度上一起登顶，拿下了具身任务智商全球第一。

在具身模子本事引颈上，星动纪元更是多次创下行业第一：

他们是全球首个提议分频 VLA 架构的团队（2024 年 9 月推出 HiRT 快慢分层架构），早于 PI、Figure、谷歌、英伟达等巨头和明星公司。

他们打造了全球首个和会寰宇模子的具身大脑。2024 年 12 月，星动纪元发布和会寰宇模子的 VLA 算法框架 VPP（Video Prediction Policy，现已开源），将具身智能的可用数据彭胀到了海量互联网视频数据，机器东说念主不错达成边念念边作念。

其研发的 ERA-42 模子，是全球仅有的四个达成了全尺寸东说念主形机器东说念主全身及五指贤惠手精确死心的标杆之一（其余三家为 Figure Helix、特斯拉 Grok 及英伟达 GR00T）。