计算机视觉领域常见的标注类型

上传人 :曼孚科技
时间 :2021年11月22日

计算机视觉领域常见的标注类型

依据数据结构的不同,数据标注业务可以划分为计算机视觉、语音交互以及自然语言处理三种类型。其中,计算机视觉又可以进一步划分为计算机视觉2D以及计算机视觉3D两种。

常见的计算机视觉标注类型包括2D框、多边形、关键点、多段线、语义分割等,3D点云又可以进一步划分为点云物体检测、语义分割等。按照具体标注工具类型的不同,以上这些标注类型可分别归类至点标注、线标注、框标注、面标注等种类。

一.框标注

框标注常用的标注类型为2D框、伪3D框与3D框。其中2D框是数据标注场景中最常见与最基础的标注工具,适用于各类场景。而3D框则适用于3D点云的多数场景,常用于自动驾驶行业,标注对象多为汽车、行人等。

二.线标注

线标注也是自动驾驶场景中常用的一种标注类型。多用于车道线标注场景下,应用于自动驾驶汽车道路识别感知算法训练中。

依据线段种类的不同,线标注又可以进一步划分为多段线(由直线段构成)以及贝塞尔曲线两种。

三.点标注

点标注常用于人脸以及人体等标注场景中,依据精度的不同,在人脸关键点标注场景下,常见的点标注数量多为24点、32点、108点等,用于标注出人脸的某些部位,比如眼睛、嘴角等。

点标注的数据多用于人脸识别、人体识别等算法中。

四.面标注

面标注常见的标注类型为多变形标注以及语义分割标注两种。其中语义分割可以理解为多个多边形的合集。但语义分割标注场景下,多边形与多边形之间是不能存在交集或未标注的区域。语义分割标注也是自动驾驶场景中应用较为广泛的一种标注类型。