2026年3月29日下午5点,在我们抵达深圳科创学院四楼时,参加“全球首届具身智能开发者大会”的20组选手,已经在这里持续开发了60个小时。
现场弥漫着一股咖啡混合着冷气的味道,随处可见没吃完的奶茶和果切,楼道里和墙角支着一个个帐篷,有选手在里面补觉,“前一天熬到凌晨4点”。
图片由智能涌现拍摄
和开发应用/软件的黑客松不同,在这场具身智能开发者大会上,看得见的,有近百台高性能六轴机械臂;看不见的,背后还有100+ PFLOPs的算力支持,以及自变量WALL-OSS、Pi0.5、英伟达DreamZero等开源基模可供选择。
图片由官方提供
“就没打过这么富裕的仗!”在B站有33万粉丝的“同济子豪兄”,在看到主办方提供的赛事支持后这样感慨。
参赛选手几乎清一色的00后。现场一支名为“MVP”的队伍在当天暂列第一,队长是一名连续创业者,有丰富的大赛经验,称自己“自备5090GPU和多款机械臂”,另外两名队员分别来自深圳大学和香港科技大学。
选手要做的,是在三天时间里,通过采集数据、适配算法,让机械臂尽可能实现单个任务的执行成功,比如把草莓苹果装进不同的篮子;或者是识别物体后,用字母积木拼出该物体的英文名称,还有更难的——把type-C线插进端口。
“之前我们叫全球首届,还担心太大了,后来看了看,确实不管国内还是国外,都不曾有过这样规模的比赛。”作为主办方,自变量机器人创始人&CEO王潜在决赛日的发言中说。
72小时内,选手需要教会机械臂识别环境、做决策、懂操作,难度颇高。王潜自己也说,“这事儿上手确实挺难”,但他也提到,把参赛时间极致压缩,能推大家一把。
自变量创始人王潜
回归真实
具身智能,当下有一个症结:“假”。
你看到的很多机器人进厂打工拧螺丝,或者在零售场景下取货收款,都是在设定好程序、环境前提下的摆拍,一旦换个场地、光线,机器人便手足无措。
大赛也“不够真”。自变量CTO王昊就对《智能涌现》说,行业目前几类赛事,有的提供纯仿真环境,虽然能控制变量,让参赛者更易上手,但离现实世界太远;还有的赛事只给选手提供数据,但所有评测过程均由主办方完成。
“我们允许选手采集数据和修改硬件和各种环境配置,让大家在模型泛化性上充分理解。”王昊说。
此次比赛设立A/B榜,选手需要从套环(抓取)、按指令分类水果(语言理解)、插电源线(精细操作)、拼写单词(长时序决策)四个中,选择针对一个任务持续攻关。
而A/B榜的差异是,A榜中,选手可以按照自己设定好的环境、任务,完成指定动作即可;但B榜,需要按照完全随机的环境,让机器完成任务。
举个例子,A榜里的套环,选手可以把木环放在套杆左边,一直按照同一个位置,让机械臂识别并完成套取;但在B榜里,审核员会随机把木环放在任何位置,还会改变灯光、桌面颜色等环境指征,看机器能否在随机条件下完成任务。
也就是说,A榜像开卷考试,考察的是选手对同一个题型的复刻能力、稳定性;但B榜,就是用纯黑盒的题型,考验选手训练的模型究竟有多少“泛化性”。
设立A/B榜,也是为了让选手回归真实,让选手不单单为了“刷榜”,只使用少量数据来优化特定场景,忽略了模型整体泛化性。
“这个比赛不想让大家停留在仿真、虚拟世界的画面里,而是上手动起来,体验物理世界的复杂性。”自变量算法合伙人甘如怡说到。
回到现实
在这场具身智能开发者大赛中,选手们摸到真实的机器,采到真实环境下的数据,得到了真实场景的模型反馈,具身智能得以回归真实。
而下一步,就是让机器人的智能,回到现实。
开发者黑客松代表的,是技术极客的想象,但技术,总要落地才有价值。
这次大赛的四个类目中,套环考验的抓取能力;按指令分类水果中包含语言理解;插电源线中对柔性物体的精细操作,以及拼单词背后的长序决策能力,都是机器人落地工厂、家庭等现实场景中必备的能力。
图片由官方提供
在这场赛事举办前夕,自变量还宣布,与58到家合作,在深圳推出智能保洁服务,让全球首个机器人保洁员上岗。
“家庭是具身智能的圣杯,它代表最广泛、最开放的环境和任务,解决了家庭任务,就代表模型可以实现完全泛化。”王昊如此形容。
必须承认的一个事实是,让机器人完全替代人类完成保洁,还不现实,在自变量与58到家的演示视频中,机器人只能实现整理物品、清洁桌面等基础动作,而像收纳大件床单这种复杂动作,还需要和真人协作完成。
那么,机器人进家庭的时间,是否应该等模型足够成熟后,再逐步实现呢?王昊并不认同这个结论。
“一开始就直面最复杂最开放的场景,才能让模型智能水平,提升到可以解决丰富场景的能力。”王昊说,“不管从什么时候开始,越早开始越好。”
不论是开发者大赛还是机器人落地,自变量的思路都相当一致。
具身智能是一个复杂的系统性工程,从数据、算法、模型工具、训练范式,行业都没有一个绝对共识,而自变量的法则是,鼓舞更多的人参与进来,在尝试中,让模型与智能迭代。
在解释举办比赛的初衷时,王潜也用“openclaw”给台下的开发者们举例:“小龙虾为什么火,并不是因为一群专业人士在做,而是无数个人开发者、无数小团队一起,把它推成了一个庞大的生态。”
“我希望能做到具身智能的平权。”王潜说。