文/韦芮 图片由成都市新津区委宣传部提供

4月9日,成都市国家数据标注基地产业发布大会在成都新津区举行。

2024年5月,国家数据局公布首批7家承担全国数据标注基地建设任务城市名单,成都位列其中。试点以来,成都作出“牵引区+聚集区”产业布局,高新区是产业牵引区,新津区则是产业聚集区之一。

数据标注是什么?简单说,就是给原始数据打标签、做标记,让机器能读懂现实世界。未经处理的图片、语音、视频,在机器眼里是一团乱码;经过归类、标记、纠错等操作后,AI才能“开窍”训练。业内有个比喻,数据是数字经济时代的“新石油”,数据标注则是“精炼石油”的核心环节——没有精炼,石油就是原油,变不成汽油和化工原料。

两年时间,新津这口“油井”炼得怎么样?


技术突围:

集聚20家企业,年产值超1亿元


2024年8月,在天府牧山数字新城核心区,新津启动了数据标注基地建设。这里紧挨地铁10号线新津站,搭乘地铁至成都双流国际机场不过5站路程,周边还有成都职业技术学院、成都艺术职业大学两所高校。2025年3月,成都市国家数据标注基地牧山园区(以下简称基地)正式开园。

成都市国家数据标注基地牧山园区。

开园一年,先看看“成绩单”。

园区相关负责人介绍,截至目前,该基地已聚集20家企业,其中上市企业2家、高新技术企业6家。2025年产值1.08亿元,服务对象包括中国电信、字节跳动、百度、京东、比亚迪等,覆盖智能驾驶、大模型、金融、医疗、低空经济等多个领域。2万平方米产业载体入驻率接近90%。

快速发展背后是新津明确的发展方向。

数据标注正在从劳动密集型向技术密集型切换。大模型时代,对标注质量、专业知识的要求越来越高,自动标注工具正在快速替代低端人力。新津发展思路清晰:走“技术型、平台型为主,劳务型、外包型为辅”的路子——这一定位,与自贡、内江、宜宾、遂宁4个省级首批数据标注基地试点城市实现错位互补发展。

成都市国家数据标注基地产业发布大会现场。

本土企业正靠技术突围。在成都市国家数据标注基地产业发布大会上,路米科技发布“数米数据标注开源平台及具身智能数据采集实验室”。这家公司累计投入4000万元自研智能标注平台,支持50余种复杂场景,标注效率较纯人工提升20%—50%,2025年产值超千万元,参与了8个行业数据集建设。

路米科技在大会现场。


未来布局:

从数据标注基地到AI产业生态


跑出了速度,搭起了框架,新津明确未来发展思路:先建数据标注基地,再打造成数据要素产业园区,最终撑起人工智能应用产业的聚集效应。

具体将如何实现?会上,可以看到几个发展方向。

一是将持续深化技术研究。

在数据标注行业,谁掌握了更先进的标注技术,谁就掌握了定价权。大会当天,中国电信数据标注技术研究中心正式启用。这个由中国电信联手基地共建的研究机构,主攻垂直领域数据标注能力研发。这意味着,将让该基地从“帮AI搬砖”升级到“研发让搬砖更高效的AI”,将新兴领域的数据标注需求转化成实实在在的项目订单。

二是将数据集做成产品。

新津的数据标注基地建设已经攒下数据家底,下一步的关键,是从这些海量数据中提炼出可复用、可交易的标准化数据集——把数据从“原材料”加工成“产品”。

医疗高质量数据集发布。

会上,四川大学华西医院联合天府绛溪实验室、新津数科集团发布了医疗高质量数据集。在业内人士看来,医疗AI对高质量标注数据的需求明确,付费意愿也强。沿着这个思路往下走,工业制造、低空经济、智慧农业——在这些垂直领域新津都有现成的场景基础,数据集产品化的空间不小。

三是把产教融合的根基打牢。

新津的优势之一就是周边高校资源。目前基地已和10所院校建立合作,培养数据标注人才700多人。

大模型标注、垂直领域标注,对从业者的理解力和行业知识储备要求越来越高。新津将数据标注基地作为一个产教融合型基地来打造——通过引企入校建产教基地,通过引校入园建产训基地,让人才供给和产业需求精准对接。

“数据标注产业的壮大,直接关系到数据供给的质量与人工智能创新的步伐。”成都市新津区数据局相关负责人表示,新津要做的,不只是给AI当“训练场”,更要成为AI赋能产业的“策源地”。

(推广)