AI预标注,数据标注行业新的发动机

上传人 :曼孚科技
时间 :2021年10月29日

AI预标注,数据标注行业新的发动机

如果说人工智能是加速数字化革命的发动机,那数据标注行业就在为其生产汽油,同时这台发动机也在反哺行业。

AI在数据标注领域主要应用于数据采集和数据处理环节,在数据采集中无论是图像或是语音数据都会出现重复样本和不合格样本,人工通过抽查或是遍历每一个样本的方式校验,在准确率、成本把控和时效性方面都大有不足,而通过使用计算机视觉和语音识别技术对采集到的样本进行初步识别,可以在短时间内达到90%以上的校验正确率,实现几倍于人力的工作效率。

在数据处理环节中,标注员需要对图像数据中每一个目标元素进行拉框或标点,目标边界需要勾描的十分精准,进行语音标注时需要聆听每一个词语的发音,判断并转写其语义,这对于标注员在长时间多任务下的专注力有着极高要求,在此环节应用人工智能可以对图像数据进行场景分割、人脸和物体识别,对于语音数据进行语音识别、文字转写和自然语言理解的预处理操作,自动完成标注后,再由人工进行校对,不仅降低了标注成本还变相增加了生产力。

目前人工智能尚不能取代人力,清楚认识其价值,并积极应用到人机协作中,将成为AI基础数据服务行业精细化管理中鲜明的竞争壁垒。