自动驾驶数据标注——新的行业风口

时间:

2022-11-15

分享到:

自动驾驶数据标注——新的行业风口

数据处理是将原始数据通过整理、分析、降噪、编辑等技术加工处理的过程。在人工智能尤其是自动驾驶领域,只有经过处理的数据才能被用于训练模型。于是,从非结构化数据到结构化数据的转变需要数据采集与数据标注来完成。

 

数据采集是利用采集车在各街道场景进行图片拍照、视频搜集、雷达点云等信息搜集,汇总后经由数据标注技术处理。数据标注指通过框选目标物体并加以分类的数据处理方式,不同场景所需的标注技术也不尽相同。

 

现阶段,人工智能早已渗入社会方方面面,医疗、金融、交通、零售、教育等行业都已通过与AI的结合完成了质的飞跃。数据标注按类目可分为图像、视频、点云、语音、文本等,自动驾驶行业所需的标注工具集中在图像、点云与视频三大类。

 

图像方面,常见的标注工具包含2D框、立体框、多边形、多段线、贝塞尔曲线、关键点、语义分割等,3D标注工具包含连续帧、融合、语义分割等,实现从道路基础设施(车道线、交通标识、绿化带等)、商铺楼房至车辆、行人的全范围涵盖。

 

自动驾驶对数据要求质量高、数量多、场景丰富,是人工智能领域对数据标注要求最高的行业,其容错率极低,与车企合作的数据标注商需将标注准确率升值99%。此外,自动驾驶也是人工智能领域对数据量需求最多的行业,据统计,为自动驾驶搜集数据的采集车每小时采集量就达十多兆,数据标注将成为继算法后车企又一个行业风口。