算法、算力与数据作为人工智能最重要的三要素一直为人们所乐道。但与算法、算力一直处于聚光下不同,数据服务行业长期处于粗放状态,打在数据标注行业身上的标签也以“劳动密集型”、“低效率”等为主。
这些标签确实在某种程度上描绘出了数据标注行业过往一段时间的状况。伴随着人工智能热潮的兴起,数据服务行业作为AI的基础层,逐渐受到越来越多的关注目光。现阶段实现人工智能的方式主要有监督的深度学习方式为主,这种机器学习的方式下,算法的训练与调优需要海量的数据做支撑,因此也诞生了海量的数据标注需求。
然而,每个行业在兴起的初期,都会伴随着一段混乱期,数据标注行业也是如此。生产流程黑盒、项目管理方式原始,导致数据产出效率低下,数据质量不尽如人意。这些弊端,在很大程度上阻碍了人工智能行业的进一步发展。
因此解决这些难题的一个重要方式就是充分发挥AI对于数据行业的反哺作用,在数据标注阶段以及数据质检阶段提升AI预标注的比重,用自动化标注以及自动化质检减少人力在工作过程中的比重,既可以提升标注效率,也可以通过不间断的实时质检,提高交付数据集的质量。
AI预标注是指利用人工智能对数据进行辅助标注,目前AI预标注主要应用于框选物体检测、多边形图像分割、OCR自动识别转体、3D点云物体检测。AI预标注旨在减少工作量、提高工作效率与标注精确度,企业可以花费更少的资源更快地推出高质量
AI 解决方案,而标注员可以减轻工作压力与重复性,但就目前来说,AI预标注扮演的更多仍是辅助类角色,用AI服务AI之路仍很漫长。