21对话|智源研究院院长王仲远:具身智能仍处早期“小组赛”阶段
21世纪经济报道记者冉黎黎 北京报道
6月10日,2026年“活力中国调研行”暨北京主题采访活动启动。
活动期间,北京智源人工智能研究院院长王仲远对21世纪经济报道记者表示,人工智能正在加速从数字世界迈向物理世界,具身智能就是其中的重要载体,也就是将人工智能装入硬件身体。“我们认为这个硬件至少在短期之内并不一定非要是人形。”
王仲远表示,整个具身智能依然处在早期阶段。一方面,硬件不够成熟,虽然能够看到现在机器人做表演、跑步都非常稳定了,但是在供应链产业链的成熟度、安全性、电池持久性等方面仍存在一系列问题。另一方面,数据依然不够,虽然在过去很长的一段时间里面使用了互联网的数据、数字世界的数据、仿真的数据来训练具身的模型,但是真机的数据非常少。
“真实数据的缺乏也就意味着模型能力还是比较弱的。”王仲远表示,“虽然我们过去也发布了一些模型,这些模型能解决一些很具体的问题,但是当我们在真实环境中部署的时候,会发现泛化性依然还不够。”
王仲远指出,大家所期待的具身智能,是将来机器人真的能够像人类一样进入工厂,简单地教它做几个示范,它就能开始干活;进入家庭,帮我们解决各种各样的任务。然而,这对泛化性、稳定性、成功率、精准性,以及对真实物理世界和物理规律、物理常识的理解,都提出了极高的要求。
他认为,目前无论是VLM、VLA,还是近一两年流行的World Action Model,都远远没有实现这样的模型能力,模型距离真正的具身智能重大突破以及产业需要仍有距离,距离机器人进入真实生活场景所需的模型能力也还有差距。这正是他判断整个具身智能仍处于早期或“小组赛”阶段的重要原因。
