人形机器人也要“进校学习”?数据采集成必答题
21世纪经济报道记者 孙燕 邓浩
7月9日,德马科技与智元机器人合作建立全球首家具身智能人形机器人物流训练工厂,部署数十台人形机器人开展真实物流场景(搬运、拆箱、分拣等)的数据采集与训练。
此前在6月,合肥市具身智能机器人数据采集预训练场启用,帕西尼具身智能超级数据工厂也投入运营。
数据被认为是具身智能的“卡脖子”问题。
东吴证券指出,不同于大语言模型可以使用互联网海量信息作为训练数据,机器人所用的具身智能模型没有现成数据可以使用,需要投入大量时间和资源进行机器人操作实践或仿真模拟,以收集视觉、触觉、力觉、运动轨迹以及机器人本体状态等多源异构数据。
为助力数据采集,训练场应运而生。
企业、政府争相落地
去年下半年以来,具身智能数据采集厂密集落地。
企业率先搭建数据采集中心,如智元机器人数据采集中心于去年9月启用,帕西尼主导建设的具身智能超级数据工厂于今年6月投入运营。
之所以要采集数据,是因为人形机器人在落地场景之前,需逐步学习并优化技能。
通常而言,单个场景的训练就可能需要百万量级的数据,但是行业早期缺少高质量且格式统一的数据库,从而制约了机器人泛化能力的提升。
为了突破数据困境,行业内出现了两种思路。民生证券研究指出,其一,以英伟达、银河通用为代表的企业试图通过仿真数据的方式,生成数据用于机器人训练;其二,以智元机器人为代表的企业建立大规模数据采集厂以收集高质量的真实场景数据,再寻求合适的比例将真实数据与仿真数据混合,以实现较优的训练效果。
一位产业人士告诉21世纪经济报道记者,该企业先在数采中心搭建工厂实景,依靠人工遥操,让机器人采集真机数据,从而训练出单个工种的小模型(或算法),以达到客户的交付要求。“一个项目POC(概念验证)要两个月左右时间,要达到较高准确性可能要半年以上。但由于工厂作业环境以及其他安全考虑,人形机器人无法一直在现场采集数据,所以我们根据制造现场搭建了实景给机器人训练。”
除了厂商自采集,地方政府也在建设数据采集中心:国家地方共建人形机器人创新中心建设的全国首个异构人形机器人训练场于今年1月启用,合肥市具身智能机器人数据采集预训练场于今年6月启用。
前述产业人士告诉记者,在G端,主要是工业、人工智能产业发达的地方政府采购人形机器人去建数采中心。由政府主导建设的数据采集中心一般是公共服务平台,所采集的数据归政府平台所有,待积累了足够多的数据后,可以提供给辖区内的机器人企业训练。
青瞳视觉相关业务人士对记者表示,该公司从2023年左右开启了人形机器人数据采集业务。“主要是to G和to B,目前在政府端、学校端、企业端都有落地。”
一套数据采集解决方案通常包括机器人、硬件、软件、云数据处理服务、软硬件售后维护、模型训练平台等。据青瞳视觉相关业务人士透露,一套数采中心解决方案售价在40万-50万元。
效率有待提高
前述产业人士指出,目前人形机器人行业都在做数据采集。“只要是专注下游应用的企业,哪怕不建大规模数采中心,也因为要做POC、交付,会搭建小规模数采中心。”
其预计,这两年行业内人形机器人出货量最多的可能在数据采集场景。“工业场景里几十台订单,量已经很大了。但建设一个数采中心,起码要到百台级别,否则经济效益不够。 ”
但当前,人形机器人数据采集仍然面临挑战。
一方面,硬件方案未收敛,数据孤岛问题提高了数据采集成本。华源证券研究指出,目前广义的人形机器人硬件结构尚存在不确定性,例如本体存在轮式方案与双足方案,手部结构如夹爪、灵巧手、三爪等机械结构尚未确定;传感器方案中视触觉、磁变传感器的方案选择与具体排布位置也未有定论。
前述产业人士也指出,人形机器人仍在快速迭代阶段:每个星期都会有模组修改,一两个月就会有零部件、局部改造,可能几个月到半年就会更新一代。
另一方面,当前人形机器人数据采集方法多数集中在关节层数据,如各自由度的角度、速度、力矩等,硬件不统一导致不同机器人关节结构差异较大,采集的数据具有极强的平台依赖性,可复用性低,数据孤岛问题极大提高了数据采集成本,使得产业端难以通过规模化降低数据成本。
而本体高自由度的累计传递误差带来的本体精度问题以及机器人本体-人体自由度不匹配导致映射算法构建困难,进而导致真实数据采集精度不够,有效数据比例较低。
前述产业人士指出,不同结构的机器人所采集的数据,若映射到新的本体上作业,数据的准确性、模型的有效性会大打折扣。
但在行业发展初期,采集数据依然是第一步。