自动驾驶技术经过多年发展,逐渐进入商业化落地应用阶段。但按照自动驾驶分级机制来看,目前可应用的自动驾驶技术仍处于L2-L3阶段,与真正意义上的自动驾驶仍相距甚远。
汽车在行进过程中,自动驾驶系统需要具备感知、策划、决策、控制等多项技术加持,这更加体现了算法的重要性。
在自动驾驶场景下,由于汽车自动驾驶过程中需要处理的场景较为复杂,开放路况下需要处理面对的不可预知场景过多,因此对算法模型的适配性要求较高。
现阶段,主流算法模型主要以有监督的深度学习方式为主,有监督学习结合了已知变量与因变量推导函数关系,借助大量结构化数据对模型训练与调优,因此为了满足自动驾驶汽车在复杂场景下的算法处理能力,就需要有海量且场景垂直度较高的数据集,以供算法模型的训练使用,这就需要数据标注行业提供强有力的支持。
然而,长久以来,作为人工智能行业的重要基础,数据标注行业的重要性却一直被人忽略。劳动密集型、粗放管理等一直都是数据标注行业身上的标签,这导致质量度高、场景垂直度好的数据集一直处于稀缺状态。这在很大程度上限制了自动驾驶行业的进一步发展。
因此,为了满足自动驾驶商业化落地应用对于高质量数据集的需求,数据标注行业内部不仅需要优化流程,提高精细化数据产出能力,同时也要提升研发能力,借助高质量数据标注工具提高数据生产效率,为人工智能产业健康发展做出更大贡献。