为什么对象追踪是最高效的视频标注法?

时间:

2022-04-18

分享到:

为什么对象追踪是最高效的视频标注法?

数据标注种类繁多,常见为图像标注、音频标注、点云标注、文字标注、视频标注等。今天,将简要介绍曼孚科技如何完成视频标注。


首先,视频标注可简单概括为是对视频的剪辑标注,标注后的数据将直接作为训练数据用于算法模型中。随着计算机视觉行业从简单的对象识别(算法可以判断对象是什么)发展到对象跟踪(算法可以跟踪特定对象),我们需要更加便捷高效的视频标注工具。


第一代视频标注法——单一图像法

视频不同于图像,但在初期,自动化工具还没有出现,人们就把视频当做图像进行标注,利用单一图像方法提取视频中所有帧数,并统一利用图像标注工具进行标注。这不仅费时费力,且无法完成对目标对象反复出现的甄别,导致错误率较高、效率低下。


为什么要专注于视频对象跟踪?

计算机视觉前沿的图像复杂性正在上升,提升对象跟踪性能就意味着利用更具扩展性的方法提升视频标注效率。曼孚科技在视频标注中正是运用对象跟踪的方法高效达成客户需求。与上一代单一图像标注方法不同,连续帧标注依靠自动逐帧追踪的方法跟踪目标对象,将视频分割成单独的图像,然后分别标注每个图像,完成连续图像中每个对象的一致分类,保证信息掌握的连贯性与灵活性。


利用这种标注方法,整个视频将作为一个整体,机器可准确追踪视频在各帧中目标对象的出现次数,尤其是随着目标对象密度的增加时,无论标注包含 2 帧还是 2,000 帧的数据,都可以更加高效的完成工作。而如果利用单一图像标注法,则极易将消失后再次出现的对象识别为新出现的目标。