成功的AI模型从数据标注开始

时间:

2022-09-09

分享到:

成功的AI模型从数据标注开始

模型对自动驾驶的重要性不言而喻,在历经起步—实验—应用—低迷—平稳发展的五个步骤后,现阶段的自动驾驶系统又有哪些需要优化的地方?如何高质量训练模型?数据起到了哪些关键作用?自动驾驶企业又该如何挑选数据平台服务商?本文将以数据层面作简要分析。


就像人不可一日不食,模型也不可一日没有数据。数据标注是自动驾驶汽车识别道路障碍物的关键,是提升模型质量的基础。


AI行业有句名言,Garbage in, Garbage out。如果计算机输入的是垃圾,那么输出的也只能是垃圾,不管这个过程有多么精细高效,即输入决定输出。所以,数据的质量对算法影响非常大。


近年来,模型对数据标注的复杂度与精细度要求越来越高,3D数据需求与日俱增,且精度也被规定至97%-99%以上,自动驾驶对数据的精准度要求很严格,因为低精度的标注数据对算法没有任何意义,这就需要与专业的数据服务商合作。


市面上数据标注服务商有很多,主要分为三大梯队,第一梯队是拥有自建平台的科技类数据标注公司;第二梯队为小有规模的自建团队;第三梯队是10人左右的小作坊(数量庞大),大多自动驾驶公司都是直接与第一梯队的数据标注公司对接。


曼孚科技作为第一梯队的成员,已深耕自动驾驶数据标注多年,专注为自动驾驶企业提供高质量数据解决方案,从源头端解决自动驾驶应用场景持续拓展对于多源异构数据的海量需求,为自动驾驶提供强劲的后盾支撑。