川观新闻记者 丛雨萌
对人形机器人来说,拿杯子这个动作并不简单:力度太大,杯子会被捏碎;力度太小,杯子会滑落。
学会了站立、行走、抓取这些“基本功”之后,机器人如何真正理解周围环境、多维度感受世界,动作更精细、更有“手感”?
答案,藏在具身智能数据里。
3月17日,具身感知驱动通用智能领域的“独角兽”企业帕西尼感知科技(深圳)有限公司(以下简称“帕西尼”)正式宣布,将在自贡国家高新区投建全模态超级数据采集工厂。这是继今年1月优必选人形机器人数据采集测试中心落地后,自贡迎来的又一家具身智能领域头部企业。
两家数据采集中心,3个月内落户同一座城市。它们为何扎堆自贡?二者要采集的数据,到底有啥区别?
要“走路干活”
也要“感受世界”
在高新区的一栋厂房里,优必选的数据采集中心已经运转了近3个月。上百台机器人一遍遍演练着物流仓库里的基本动作“抓拿取放”,每一次动作都被转化为可供算法学习的数据。这个被称为“机器人职校”的工厂,核心是让机器人通过反复练习,掌握操作技能。

真人正在模拟洗碗动作。
同为数据采集中心,帕西尼要做的是另一件事。
人体内有一个叫“帕西尼小体”的器官,是高敏性触觉感知器官之一。这家企业要做的,就是给机器人装上类似的“触觉神经”,“你可以理解为,我们是在教机器人‘感受’和‘理解’真实的物理世界。”帕西尼公共事务及战略总监罗霄恒打了个比方。
“机器人发展了几十年,为什么一直没能广泛走进日常生活?一个很重要的原因是,它缺乏触觉感知能力。”罗霄恒说,没有触觉的机器人,不知道面前的水杯是什么材质、有多重,不知道该用多大的力去抓,“要么把杯子捏碎,要么让杯子滑落。”

真人正在佩戴PMEC触觉采集手套采集数据。

真人正在佩戴PMEC触觉采集手套采集数据。
与其他数据采集方案不同,帕西尼采用的是“以人为中心”的全模态数据采集体系——在采集现场,真人佩戴着PMEC触觉采集手套,执行各种日常操作。空间内布满RGB和RGB-D摄像头,从多个视角同步记录视觉、深度信息。手套上的触觉传感器,则实时采集手部与物体的接触数据——拿起杯子时的力度、捏住鸡蛋时的轻重、握住工具时的角度,都会转化成压力、振动、滑移等数据。

空间内布满RGB和RGB-D摄像头,从多个视角同步记录视觉、深度信息。
采集到的高精度数据,会被怎么处理?经过复杂的全模态时空数据对齐和融合处理后,触觉、视觉、语音、文本、运动轨迹等多源信息被统一成标准格式。“这些数据就像为机器人撰写的教科书。”罗霄恒说,最终形成的全模态数据集,可以让不同构型的机器人都能从中学习。也就是说,无论机器人的尺寸、结构、高低如何,数据经过转换后,都能适配使用。
“人是最灵活的,人的动作是最自然的。”罗霄恒解释,通过真人采集,可以获得最符合物理规律的真实数据,同时避免了传统遥操作方式中动作不协调的问题。
这套体系的效率也相对较高。这种“以人为中心”方式下的数据采集速度,是传统遥操作方式的3到6倍,且不需要依赖昂贵的机器人本体,降低了数据采集成本。
“目前具身智能行业还在快速发展阶段,需要更多的技术路径共同探索。”帕西尼技术负责人表示,不同技术路线采集的数据,最终将共同构成机器人学习的“教科书”。在他看来,两种方式各有侧重,相互之间可以形成合力,共同为行业发展积累宝贵的数据资源。
今年,帕西尼将正式公开自己的具身智能数据商城,向全行业开放数据购买。“我们的数据不仅自己用,也向行业开放。”帕西尼联合创始人聂相如说,去年就已经在北京国际大数据交易所上架,后续还将通过自建网站面向各行各界提供数据服务。
三个月内落地两家数采中心
为什么是自贡?
今年1月,优必选落地自贡;3月,帕西尼也选择和自贡牵手。两家具身智能数据采集领域头部企业,为何不约而同选择了自贡?
答案跟自贡的产业布局紧密相关。
近年来,自贡将人工智能作为转型发展的赛道之一,以数据标注为突破口,逐步形成以智能驾驶、具身智能、大模型训练数据为核心的特色标注产业。百度、腾讯云、火山引擎等头部企业已相继落户,数据标注基地累计实现产值近5亿元,带动就业5000余人。
“自贡对数据产业的规划非常明晰。”聂相如说,从接触到落地,自贡方面表现出的诚意和效率,让他们坚定选择落地这里。
另一个重要因素是成本。
作为成渝地区的节点城市,自贡距离成都仅两小时车程,但用地、用工成本更具优势。“前店后厂”的模式——成都作为研发总部,自贡作为数据生产后场——成为帕西尼布局西南的理想选择。
与此同时,自贡正在形成的产业生态,为具身智能提供了丰富的应用场景。低空经济领域的无人机、新能源领域的智能制造、文旅领域的仿真恐龙……“机器人未来要拥抱千行百业,我们希望可以拥抱到所有的场景。”聂相如说。
按照规划,帕西尼自贡工厂将依托万平方米级实景基地,布局数百个标准化采集单元,具身实采数据产能预计可达数十亿级规模。“满产后,人力需求会达到上百人规模。”聂相如透露,这些岗位将包括数据采集员、数据处理工程师、算法优化人员等,为当地创造高质量的就业机会。
近日,四川省发展和改革委员会等9部门联合印发的《关于支持数字经济高质量发展的若干政策措施》正式对外公布。这份文件围绕六个方面推出17条政策,其中“人工智能1号创新工程”明确提到:鼓励企业牵头建设符合国家相关标准要求的高质量数据集,安排资金支持行业高质量数据集、人工智能语料库、数据标注公共服务平台、数据集管理服务平台、数据训练场5类项目建设。单个项目安排不超过核定总投资的25%、最高1000万元的资金支持。
“这对我们来说是重大利好。”聂相如表示,高质量数据集建设正是帕西尼的核心业务方向,支持政策的出台将进一步降低企业创新成本,加速数据要素的价值转化。
自贡市科技局相关负责人告诉记者,按照规划,自贡正计划设立数据要素聚合创新中心,聚焦数据要素“聚合—流通—应用—安全”全链条,推动产业数据高效流通与价值转化。到2027年,自贡计划落地人工智能企业100户以上,常态化就业万人以上。
(图片由受访者提供)
【未经授权,严禁转载!联系电话028-86968276】

关注一下