编者按:数据标注产业,属于少数有大意义的“小产业”。
说它小,是因为全国市场规模预计今年也到不了300亿元,业内仅有几家上市企业,且其年营收都不超过5亿元。但就是以这般小体量,它却能吸引到国家多部委发专文支持,原因很简单:AI大模型训练亟需高质量数据,而数据标注是高质量数据供给的一个关键环节。
数据标注本质上是将人类知识转化为机器可识别的语言,为AI大模型学习提供“教材”。去年,国家数据局公布了首批7个承担全国数据标注基地建设任务的城市名单,四川省成都市入选。如今试点基地建设已满一年,产业在蓉发展如何?川观智库在专题调研过程中发现了一些值得关注的新情况、新变化。而要深入了解它们,可以从对三个新现象的追问开始。
川观智库研究员 熊筱伟
一线调研期间,不断有数据标注企业负责人提起同一件事:今年开始只招本科生了。
对数据标注产业来说,这件事确实算得上新鲜。毕竟这一行长期被看作是劳动密集型产业,从业者也以大专和中专学历为主。为什么今年突然招聘学历门槛抬高?这背后蕴含了怎样的产业发展新趋势?

Part.1
现象背后的新趋势是什么?
下游AI大模型产业的重心转移,使上游数据标注业务发生结构性变化
多名企业负责人告诉川观智库研究员,抬高学历要求主要是针对标注员团队。
成都市汇众天智科技有限责任公司总经理骆靖元说,去年招聘标注员还是大专学历起步,今年把门槛提到了本科。成都小咖邦智能科技有限公司总经理马欣伟谈到,如今新员工要求至少本科学历。澳鹏数据科技(上海)有限公司市场及政府关系副总裁项蔚表示,全国员工中有78%是本科及以上学历,而在今年成立的成都子公司,这个数字达到了99%。
这样的现象如今并不鲜见。中国信息通信研究院人工智能研究所等单位今年8月发布的《数据标注产业发展研究报告(2025年)》提出,数据标注行业对从业者的专业素养要求越来越高,高学历背景和多学科融合成为从业者的基本特征。
专业素养要求为什么会越来越高?今年为何开始强调高学历?
对此,企业负责人的回答基本一致:因为业务需要。“以前业务相对简单,基本都是常识类、生活类信息。图片上有一只猫,你把猫的轮廓标出来就行。”骆靖元表示,如今甲方项目的难度明显增加,比如看图片变成了看CT片,标注猫变成了标注人体骨肿瘤位置,这当然会对标注员专业性和学习能力提出更高要求。成都优易智数科技有限公司总经理金守超提到,下半年要招聘一批汉语言文学专业的大学生,“因为接了相关项目,需要有文学底蕴。”
综合受访企业反馈,大体能勾勒出当前数据标注需求正在发生的结构性变化:一方面,语音、人脸标注等传统需求增长开始减速甚至停滞;另一方面,聚焦垂类领域的数据标注需求出现快速增长,尤其智能驾驶、具身智能两个领域最多,医疗、美学、文学等领域次之。
这些变化的根源,是下游AI大模型产业的重心转移。根据亿欧智库《2024中国“百模大战”竞争格局分析报告》,2025年至2028年通用大模型格局逐渐趋于稳定,垂类大模型赛道将成为大模型产业激烈竞争的领域——相对于通用大模型,垂类大模型聚焦特定领域或行业,对数据标注的专业性自然会提出更高要求。

Part.2
趋势带来的新变局是什么?
从数据标注产业视角看,地方和企业的比较优势都在被重新定义
上述趋势的发展,会给数据标注产业带来什么变局?
马欣伟的经历,直观反映了其中一类变化。他所属母公司2015年在上海市成立,但直到去年他才受命来成都组建子公司。为什么不更早来蓉?马欣伟的回答很有意思:以前没必要来成都。
至于原因,他说得很坦诚:因为成都人力成本相对较高。这一点也得到受访企业广泛认同。四川淘金你我信息技术有限公司总监杨志发坦言,企业把全部约200名标注员都搬到了山西、湖南两省,在成都仅保留管理运营团队。这样做的主要理由就是节约人力成本,“山西、湖南(普通标注员)人均工资差不多,都是每月3000多元。但成都周边区市县现在没有4000元就招不到人,市区更贵。”此外,受访者谈到即便是省内其他市州,目前和部分已经形成产业集聚的省份(如河南、山西)相比,仍然缺乏人力成本优势。
但上述事实和看法,都是基于数据标注作为劳动密集型产业的大前提。而马欣伟和同事如今选择落地成都,反映了这一判断前提正在发生改变——随着AI和垂类大模型进一步发展,数据标注产业将逐步从“劳动密集”向“知识密集”转变,“人才储备”也将逐步替代“人力成本”,成为企业更看重的地方资源。多位受访者都谈到,这或许也是国家级数据标注试点基地之所以落地在高校云集的成都,而非其他人力成本更低城市的重要原因。
川观智库研究员注意到去年至今,一批头部数据标注企业已经或正在考虑落地成都。澳鹏数据科技(上海)有限公司于今年5月、路米科技(江苏)有限公司于去年9月均在成都设立新公司。京东云西区业务负责人谈到,目前正在和成都接洽数据标注业务落地事宜。至于落地理由,受访者普遍提到看重成都人才梯队相对完整且数量庞大。
地方的比较优势正在被重新定义,而同样的事也发生在企业身上。
根据受访企业反馈,卷价格等传统竞争方式的有效性将逐步减弱,数据标注企业之间的竞争焦点将转向构建专业团队和相关能力。而这一变革的出现,又催生了AI大模型风口中的一些新现象。对此川观智库将在《三问数据标注产业②》中持续探讨。
相关阅读
【未经授权,严禁转载!联系电话028-86968276】

AI技术已经广泛应用了
地方的比较优势正在被重新定义,而同样的事也发生在企业身上。
劳动密集型
密集型产业需要创新人才!
厉害
提高劳动者素质,促进企业发展!