深读|人机协作中,他们教机器“读”世界
推荐阅读: C919生产开门红,“今年有望每15天内造一架” 哥伦比亚失联客机确认坠毁 机上15人全部遇难 泰国清迈一架军用飞机坠毁 伤亡不明 军报记者寻根行丨永远吹响“冲锋号” 美报告称中国是其面对最强大国家 美媒披露:美空军8天内向中东地区调派至少42架重型运输机 特朗普发出“最后通牒”,敦促伊朗进行谈判并达成协议,否则将动武,伊朗表态 “我警告特朗普中期选举‘药丸’,他骂:去你的” 韩国没招了:又怎么了,我的好盟友 俄贝加尔湖冰面发生翻车事故,造成中国籍游客1死4伤 英首相斯塔默在故宫发表讲话:访华收获很大 整治足球“假赌黑” 13家俱乐部被罚 陈戌源李铁等73人被终身禁“足” 女星金晨被曝涉嫌交通肇事逃逸,绍兴柯桥区交警回应:正核实 国防部:所谓“击沉”中国军舰动画纯属自嗨 起底全链条造假骗取生育津贴案:一公司15名员工13人生育,申领超百万 斯塔默:中国已经崛起 日本官员劝渔民:不要去,会惹怒中国 “加拿大进口中国电车,一整个期待住了” 盒马错发水仙女子索赔375万降至48万 中国代表:支持伊朗国家稳定 武力解决不了问题
人工智能的广泛应用背后,离不开这些数据标注员日复一日的标准化劳动,作为人工智能中的“人工”,他们也被称为AI“砌墙人”。如今,产业升级正推动这个行业从劳动密集型转向技术与知识密集型。在江苏,一场关乎质量标准、人才缺口与权益保障的竞赛已经鸣枪,这场竞赛的结局,将决定我们如何塑造一个既智能又包容的未来。
数据标注行业驶入“快车道”
“目前,江苏淮海科技城内已聚集20多家数据标注相关企业,规模小的不足50人,规模大的则超过200人。”据江苏淮海科技城相关负责人介绍,这些企业的标注业务主要围绕三类通用模型展开:一类服务于车企的自动驾驶系统,一类面向豆包、千问等大语言模型进行文本与图像标注,还有一类则专注于京东、淘宝等电商平台的商品信息标注。
市场调研机构艾瑞咨询的数据显示,到2025年,中国人工智能数据采集与标注服务市场规模预计将突破120亿元。在江苏,数据标注相关岗位的招聘信息遍布各地:南京某研究院招募标注工程师,月薪可达万元,提供双休与五险一金;徐州有企业面向实习生开放岗位,月薪3000至4000元,月休8天;太仓则有公司大规模招聘标注员,月薪4000至6000元,并提供住宿。这些招聘信息,共同勾勒出一个正在快速扩张的新兴就业领域。
淮安39岁全职宝妈储夏,经过培训成为一名数据标注师,她参与的人脸识别标注项目与“AI寻人”平台紧密相关,这份工作为她拓展了职场新技能。28岁的仪征青年谢昌友,童年时因事故导致双手仅拇指完整、左眼失明、左腿留有烫伤。通过当地残联的培训与推荐,他经过系统学习,成为一名专注于自动驾驶场景的AI训练师。如今,他每天仔细标注着收费杆、限高杆等各类交通标志,这些精准的数据将帮助车辆更准确地识别路况。他很庆幸,自己在人机协作的宏大链条中,找到了一条能够自力更生的就业之路。
然而,这份看似“坐在电脑前就能完成”的工作,实则对专注力与耐力有着严苛要求。盐城的地图标注员徐莉告诉记者,她每天需处理超过1500条视频数据,遇到紧急项目时甚至加班至深夜;无锡某公司的吴语方言标注员何颜,则要反复听辨、转写200多段艰涩的方言录音,将其逐一转化为文本。
在南京市浦口区一家企业工作的孙华,是行业里的“老标手”。他坦言,这行看重效率与经验:新手日标量或许只有200多条,熟练工则可突破1000条。但他也感慨:“现在行业越来越‘卷’,任务更重、要求更细,除了加班辛苦,还要反复修改返工。”长时间执行高度重复、标准严格的操作,带来的不仅是身体上的僵硬与视疲劳,还有日积月累的心理倦怠。孙华告诉记者,为提高效率,很多企业管理日趋严格,上班期间,手机经常被集中保管,仅允许接听使用。这让他觉得,自己是“数字流水线上的工人”,与光鲜的算法世界之间,隔着一道看不见的墙。
随着大模型技术快速迭代,数据标注的维度正从2D向3D、4D拓展,对精准度的要求达到前所未有的高度。江苏京数智能科技总经理张启航表示,数据标注行业的人才门槛正持续提升:早年初高中毕业生即可入行,如今普遍要求大专及以上学历。而医疗、金融等专业领域的标注岗位,则明确要求本科及以上学历和相关学科背景。薪酬结构也随之分化:通用型标注员月薪多在3000至4000元,而具备医药、法律等专业背景的标注人员,月薪可达8000元以上。
产业升级倒逼人才向专业纵深转型
技术革新推动“人机协同”进入更精密的阶段,这背后是对数据标注人才专业能力要求的提升。
医疗领域的应用尤为典型。江苏微控生物科技研发的宫颈细胞图像分析软件,采用“AI初筛+人工复核”模式,将诊断敏感性提升至95%以上。项目相关负责人王淑娟认为,传统病理诊断依赖医师人工审阅切片,病理报告需要在显微镜下人工审阅,一天处理百张切片已属高效,效率受限且专业医师资源稀缺。该系统的标注工作由全国15位资深病理学专家共同完成,他们依据液基薄层细胞学诊断标准,结合细胞核浆比、染色特征、核面积大小等微观形态,精准标注病变细胞。据悉,该模式未来还将拓展至阴道微生态分析、尿液脱落细胞检测等更多系统。
在远洋航运这类高门槛领域,专业化标注同样展现关键价值。曾长期被国外垄断的气象导航技术,已被无锡九方科技有限公司自主研发的系统突破。项目负责人顾侃介绍,其标注团队兼具海洋学与计算科学背景,工作不仅涉及海洋、海岸线等常规地理信息标注,更包含排放控制区、保险冰区、渔区、海盗活动区等特殊区域的识别标注,这些专业力量的加入,成为系统实现精准气象导航与航行安全预警的核心支撑。
产业升级,直接推动了人才标准的显著提升。部分头部企业标注团队处理的,已不再是简单图像,而是融合行业知识的复杂场景。扬州小云智能科技有限公司负责人傅永红认为,数据标注行业正在经历结构性转型:基础性的框选、分类等需求逐渐萎缩,而面向小语种、金融、医疗、法律、工业等垂直领域的深度标注需求快速增长。这一转变不仅意味着部分基础岗位可能被替代,更推动整个产业从劳动密集型转向技术密集与知识密集型的新形态。“现在,通用大模型的数据需求已相对饱和,但高端标注岗位却面临严重的人才短缺。”傅永红坦言。
面对人才瓶颈,“产教融合”被视为破局的关键。傅永红告诉记者,扬州小云智能科技有限公司通过与高校联合,打造“AI+产教融合”模式,利用自主研发的智能平台,每年向行业输送超过2000名高技能人才,可为长三角AI产业直接输送即战型标注工程师。2025年,在扬州市职业技能鉴定中心组织的全省数据标注专项能力考核中,他们公司60余人通过认证,误差率控制在2%以下。
江苏省正系统推进相关人才培养。由无锡数据集团、江苏省无锡技师学院与江南大学共建的人工智能实训基地,计划一年内培养超千名专业人才。同时,省政府将“人工智能训练师”等数字技能纳入省级高水平技能竞赛,以赛促学、以赛促训,全面提升全省数字人才职业能力水平。
如何在质量瓶颈与权益保障中破局?
在从劳动密集型向技术密集型的深刻转型中,数据标注产业不仅面临高质量训练数据短缺、高端复合型人才供给不足等普遍性问题,还需要突破标注质量稳定性不足等制约行业发展的瓶颈。
“数据标注领域长期存在一个核心矛盾:供需双方对质量标准缺乏共识,行业内既缺少统一的评估体系,也缺乏客观的第三方评价机制。”钟吾大数据集团相关负责人郭润仙坦言。为此,该集团正与中国质量认证中心合作,共同构建覆盖全流程的数据标注质量标准体系,并建立多级质量评估指标。“在标准实施后,我们的数据质量评价等级提升了1—2个级别,标注效率也提高了20%以上。”她补充道。
产业蓬勃发展需要不断补充高技能人才,那初期吸收的大量专业程度较低的从业者怎么办?张启航表示,大量通过众包平台接单的标注员如今陷入“高投入、低收入”的困境,工作高度碎片化,缺乏稳定性与基本保障,在社保缴纳、劳动关系认定等方面处于明显弱势地位。
“当前我国的零工经济政策,仍主要聚焦于外卖、网约车等生活服务领域,像数据标注这类‘生产服务型众包’尚未被纳入制度保障的核心范畴。”南京师范大学社会发展学院教授吴亦明分析认为,面向灵活就业的社会保障制度亟须创新,他建议探索“零工社保套餐”等新型保障模式,为包括数据标注员在内的广大灵活就业群体建立更规范、可持续的权益保障体系。同时,也应通过必要的培训与考核机制,提升从业人员的专业素养与行业门槛,推动其向更加专业化、规范化的方向发展。
为系统引导并支撑产业升级,《江苏省发展数据标注产业建设高质量数据集实施方案(2025—2027年)》明确提出到2027年底建成全国领先、全球有影响力的数据标注产业集群的发展目标,力争产业规模占全国比重超过10%,核心在于推动行业向精细化、专业化、智能化方向发展。
在江苏省社会科学院研究员丁宏看来,数据标注行业仍是一片蓝海,“未经标注的数据难以实现有效利用、合理定价与规范交易。数字经济的深化发展,离不开高质量数据标注的支撑。”无论是通用型还是垂直领域的专业化标注,江苏都需要进一步提升其专业化与智能化水平,以此推动整个产业向更高层次迈进。同时,江苏还要积极推进数据要素的市场化流通,为数字经济发展注入更强劲的动力。
新华日报·交汇点记者 周娴 实习生 任馨怡
推荐阅读: 英首相斯塔默在故宫发表讲话:访华收获很大 整治足球“假赌黑” 13家俱乐部被罚 陈戌源李铁等73人被终身禁“足” 女星金晨被曝涉嫌交通肇事逃逸,绍兴柯桥区交警回应:正核实 国防部:所谓“击沉”中国军舰动画纯属自嗨 起底全链条造假骗取生育津贴案:一公司15名员工13人生育,申领超百万 斯塔默:中国已经崛起 日本官员劝渔民:不要去,会惹怒中国 “加拿大进口中国电车,一整个期待住了” 盒马错发水仙女子索赔375万降至48万 中国代表:支持伊朗国家稳定 武力解决不了问题