自动驾驶技术的稳定运行,依赖于对复杂环境的精准感知与判断。多模态数据作为环境感知的核心输入,涵盖图像、激光雷达点云、毫米波雷达信号等多种类型,不同模态数据在信息维度、时空特性上存在差异,单一模态标注难以满足自动驾驶系统对环境理解的全面性与准确性需求。自动驾驶多模态数据融合标注通过整合不同模态信息,实现数据标注结果的互补与优化,为自动驾驶算法训练提供高质量标注数据支撑。
一、数据层融合标注方法
数据层融合标注聚焦于原始数据层面的信息整合,在数据采集阶段同步完成多模态数据的时空校准,确保不同模态数据在时间与空间维度上的一致性。该方法先通过硬件同步机制,实现图像传感器、激光雷达、毫米波雷达等设备的时间戳对齐,再利用标定算法完成设备间的空间位置校准,消除因设备安装位置差异导致的空间偏移。
在标注过程中,以一种模态数据作为基准标注对象,例如以激光雷达点云数据为基础,利用其三维空间定位精度优势完成目标轮廓与位置标注,随后将标注结果映射至图像数据与毫米波雷达信号中。通过多模态数据间的像素级、点级关联,修正单一模态标注中可能存在的误差,如图像数据在光照变化下的目标误判、毫米波雷达对静态目标识别精度不足等问题,形成统一的原始数据标注集合,为后续特征提取与算法训练提供底层数据保障。
二、特征层融合标注方法
特征层融合标注侧重于从多模态数据中提取关键特征并进行融合标注,在数据预处理阶段完成特征提取后,对不同模态的特征信息进行关联与标注。图像数据可提取目标的颜色、纹理、形状等视觉特征,激光雷达点云数据可提取目标的三维坐标、尺寸、表面法向量等空间特征,毫米波雷达数据可提取目标的速度、距离、径向加速度等运动特征。
标注过程中,通过特征匹配算法建立不同模态特征间的对应关系,例如将图像中目标的视觉特征与激光雷达点云中目标的空间特征进行匹配,确定同一目标在不同模态特征集中的对应位置。基于匹配结果,对多模态特征集进行统一标注,标注内容包括目标类别、属性、空间位置、运动状态等信息。这种标注方法能够有效整合不同模态数据的特征优势,减少冗余信息干扰,提升标注结果的精准度与鲁棒性。
三、决策层融合标注方法
决策层融合标注立足于多模态数据的独立标注结果,通过融合策略对各模态的标注结果进行综合分析与优化,形成最终的统一标注结论。首先,对图像、激光雷达、毫米波雷达等不同模态数据分别进行独立标注,得到各模态对应的初步标注结果,每个模态的标注结果均包含目标的类别、位置、属性等信息以及相应的置信度评分,置信度评分反映该模态标注结果的可靠程度。
随后,采用多源信息融合算法对各模态标注结果进行处理,常见的融合算法包括投票法、加权平均法、贝叶斯推理法、D-S证据理论等。例如,投票法通过统计各模态标注结果中目标类别的得票情况,将得票高的类别作为最终标注类别;加权平均法则根据各模态的可靠性赋予不同权重,对目标的位置、属性等连续型标注信息进行加权计算,得到融合后的标注结果。决策层融合标注方法能够充分利用各模态数据的独立判断能力,降低单一模态标注误差对结果的影响,提高标注结果的稳定性与可信度。
自动驾驶多模态数据融合标注方法从数据层、特征层、决策层三个维度出发,分别针对原始数据、特征信息、独立标注结果开展融合标注工作,各方法均有其独特优势与适用场景,共同为自动驾驶系统提供高质量的标注数据。