4月1日,由中国电子信息产业发展研究院(赛迪研究院)、工业和信息化部新型工业化研究中心主办的2025赛迪论坛在京举办。杭州宇树科技有限公司副总经理王启舟在主论坛发表主旨演讲。他表示,具身智能的发展进程与人形机器人的迭代息息相关,这也是产业和学术界关注的热点课题,但目前仍然没有实体能够实现具身大模型的底层突破。
在王启舟看来,人形机器人的发展与人工智能的发展息息相关。
他回顾了人工智能发展历程,强调了其中几个具有历史意义的时间节点。在推理上,1962年,机器战胜全美最强跳棋手罗伯特·尼雷;1997年,“深蓝”击败了国际象棋大师卡斯帕罗夫;2016年,AlphaGo战胜了围棋选手李世石。在此进程中,状态空间复杂度实现了指数级增长。其实人形机器人的发展也得益于人工智能技术的进步,在三年前,人形机器人连站稳行走都很苦难。
王启舟表示,宇树科技之所以能在四足机器人领域实现“弯道超车”,也得益于人工智能技术的发展。其中,王启舟着重对DeepSeek的技术创新进行了剖析。总结来看,DeepSeek的创新点可以体现在四个方面:第一是架构创新,该模型的推理效率提升了300%,支持模块化稀疏激活MoE(混合专家模型)架构,提升了模块细粒度;第二是数据创新,该模型实现了高知识密度的数据训练,训练成本仅相当于海外知名模型的1/10;第三是算力创新,该模型支持低位宽混合浮点计算,使内存开销削减到海外知名模型的一半;第四是算法创新,该模型取消过程奖励,引导模型思考,利用群体策略减少有监督微调。而这些技术积累,都帮助企业在端到端的人形机器人以及其他类型机器人实现新的创新突破。具身智能是与人形机器人发展更为相关的一条技术路径,这是人工智能的一个子课题,但又在人工智能的基础上做了新的延伸。它融合了视觉感知、学习理解、智能计算等一系列的智能技术,使智能体即机器人等智能终端在环境中具备感知决策和行动的能力。
为了更好地理解具身智能的技术发展阶段和未来技术走向,产业界可以借鉴智能驾驶的评级标准来界定具身智能的能力。当前,业界对具身智能的发展阶段的评级还没有完全形成共识,但已经有了大致的不同级别具身智能可实现的功能分野:L1级具身智能只能实现语音交互、信息识别、简单操作和模仿学习;L2级具身智能具备数据处理、规律总结、推理学习和行为纠正的能力;L3级具身智能可具备即时处理能力;L4级具身智能具备自主学习能力;L5级具身智能将具备思维决策能力。但截至目前,大多数机器人的技术发展水平还较为有限,仅处于L1级,或由L1级向L2级跃升阶段。要实现更高级别的发展,仍需要人工智能技术、智能感知等技术的支持。
当前具身大模型是全球诸多公司和研究机构追捧的前沿的课题,但仍没有公司实现了底层突破。
王启舟将宇树的机器人定义为通用机器人。它依托机器人硬件实体,借助机器人世界模型建立对世界的理解做功能实现。所谓的世界模型,是构造机器人对物理世界有理解能力的模型,包括对物理规律、图像视频、音频等,并且结合模仿学习来学习策略,用强化学习最后成功收敛到100%可靠控制。
他表示,宇树不会做所有的垂直领域的应用,只会做一些典型的应用。在工业方面宇树将提供电机性能够强、负载够高,具备面向工业、物流等场景基础能力的机器人。其客户可以在拿到机器人之后,利用垂直行业数据,进行相关场景的模型训练。例如,如果客户将机器人用于电动汽车生产,则机器人将可能通过在某工序上持续训练,逐渐实现很高的成功率和作业的质量,从而完成这项任务。
关于人形机器人的未来前景,王启舟说道:“行业里流传着一种说法——通用机器人能够在3—5年内率先实现工业领域的突破。目前,人形机器人还不能胜任一些对精细度要求比较高的任务,但随着各项技术的突破,机器人也将逐渐适应精细工作的需求,从而能够胜任各种工业生产作业要求。”
本文刊于4月2日《中国电子报》
温馨提示
如果你喜欢本文,请分享到朋友圈,想要获得更多信息,请关注“赛迪智库”。
我们的推送时间是10:00或17:00,一定不要忘了给“赛迪智库”设星标哦!
看都看完了,还不点这里试试