人工智能时代,标注软件是如何进化的

时间:

2022-02-24

分享到:

人工智能时代,标注软件是如何进化的

众所周知,深度学习离不开大量训练数据,训练数据离不开数据标注。

 

数据标注是人工智能的核心与基础之一。伴随着人工智能行业落地化进程的不断加速,对数据标注的要求也愈加提高,质量与效率成为了数据标注行业新的共同追求。

 

在行业的不断发展探索之下,目前数据标注的准确率记录不断被刷新,已经达到了99.99%,这不仅仅是数字的变化,更意味着数据标注由“人工密集”向“技术密集”方向的转变已经显现,借助优秀标注软件提升数据标注效率将成为行业不断攀升的必然趋势。

 

那么标注软件是如何进化的?

 

在诞生专用标注工具之前,数据标注工作通常是借助Ps等图像类编辑软件来进行,无论是在效率还是匹配度上均存在诸多不足,尤其随着数据标注市场需求的极速扩张,行业对专业数据标注工具的需求愈发急迫,因此第一代数据标注工具应运而生,比较典型的例子即是Labelme。

 

此类标注工具可以做到基本覆盖常见的图像类标注类型,比如拉框、描点之类的。但是随着数据标注行业向精细化、场景化方向延伸,此类数据标注逐渐暴露出各类问题,比如覆盖场景有限,无法处理一些复杂场景的数据,同时也不具备一定的项目管理能力,仅解决标注单一流程。

 

因此,标注工具进化到第二代。第二代标注工具的核心特征是:多场景标注能力+有限项目管理能力。用户可以在工具内执行一些简单的项目管理工作,比如分配任务。但这种项目管理能力实验性质居多,既不成体系,也不具备实用性。尤其随着AI商业化进程的加快,如何高效率、高质量的产出更多数据集成为下一代数据标注工具的核心竞争力。

 

目前,数据标注已经发展到第三代,相较于前两代,现在的标注工具已不再是简简单单的工具,而是进化成平台。标注平台的突出特征是:数据全生命周期管理能力+供应链管理+项目协同+AI人机协同+自定义权限+全场景覆盖标注能力。

 

以曼孚科技SEED数据处理平台为例,SEED平台涵盖标注所需的全部工具,除了覆盖全场景的标注能力以外,还具备全流程的项目管理能力以及高效的AI自动化标注能力。无论是在数据产出效率还是在数据质量提升方面均较以往工具有成倍提升。

 

在未来,曼孚科技将继续优化SEED数据服务平台,持续聚焦AI基础架构建设,专注企业级数智化运营能力搭建,为人工智能应用的商业落地增添更多助力。