随着计算机视觉在“人脸识别”、“自动驾驶”、“自然语言处理”等领域的飞速发展,对数量的需求也愈加庞大,可以说,数据决定着整个人工智能行业的发展态势。
在现有的技术框架下,数据标注量越大,质量越好,算法模型就表现越好。因此,针对不同的应用场景,衍生出了多种图像标注方法。
2D框标注
标注师在要标注的对象四周划矩形边框,又叫拉框标注,是目前应用最广泛的一种图像标注方法,能够以一种相对简单、便捷的方式在图像或视频数据中,迅速框定指定目标对象。它是所有标注工具里最普通且成本最低的图像数据标注方法。
线标注
在图像上利用多个标注点的连线给直线或曲线打标签,线标注主要用于自动驾驶汽车的道路识别,用于定义车辆,自行车、相反方向交通灯、分叉路等不同道路。
全景语义分割
语义分割是指根据物体的属性,对复杂不规则图片进行的区域划分。值得注意的是,标注师得到的是一系列分割标签以分离图像,而不是一系列需要标注的对象。因此,其需要完成图像内每一像素点的标注任务,每一区域通常都以某种独特的颜色表示,标注师在要标注的像素点周围画线,并选择合适的属性标签。
多边形标注
多边形标注指在图像中使用多边形框标注出不规则的目标物体,相较于矩形框标注,多边形标注能够更精准地框定目标,使标注师能够在目标对象的每一顶点绘制点位。无论形状如何,这一标注方法都能准确标注对象的所有边缘,因此对于不规则物体,多边形标注更具有针对性。
3D框标注
与点云不同,3D框标注还是基于2D图像,标注员通过对立体物体的边缘框定获得空间视觉模型,进而获得灭点,测量出物体之间的相对距离。
关键点标注
在规定位置标注上关键点,利用多个连续的点确定巨大和微小物体的形状变化,通常用于统计模型、人体姿势及人脸特征点、人体骨骼连接点等面部识别模型。
以上所有标注方法都可在曼孚科技的核心产品SEED数据服务平台实现,除图像标注外,SEED也可完成对文本、语音、视频以及3D点云的数据标注需求。