经过多年发展,自动驾驶逐渐进入商业化落地应用阶段。但按照自动驾驶分级机制来看,目前可应用的自动驾驶技术仍处于L2-L3阶段,与L4、L5级的完全无人驾驶仍有较大差距。
众所周知,感知、决策、执行技术帮助汽车行进过程更加智能化,而这些技术都离不开算法的加持。
在自动驾驶场景下,由于汽车自动驾驶过程中需要处理的场景较为复杂,开放路况下需要处理面对的不可预知场景过多,所以算法模型的适配性尤为重要。
现阶段,主流算法模型主要以有监督的深度学习方式为主,这种方式需要海量的结构化标注数据训练或调优模型,因此,高质量、大数量、高垂直的数据集是满足自动驾驶复杂场景处理能力的基础,以供算法模型的训练使用,这就需要数据标注行业提供强有力的支持。
然而,长久以来,人们在算法上投入了过多精力,对人工智能行业另一基础层——数据标注却经常忽略,粗放管理等一直都是数据标注行业身上的标签,这导致质量度高、场景垂直度好的数据集一直处于稀缺状态。这在很大程度上限制了自动驾驶行业的进一步发展。
因此,为了满足自动驾驶严格的数据需求,数据标注行业内部不仅需要优化流程,提高精细化数据产出能力,同时也要提升研发能力,利用高质量数据标注工具提升数据产出率,加速自动驾驶产业健康、有序发展。