随着人工智能领域的探索不断深入,高铁和城市交通逐渐走向智能化,越来越多的图像识别算法应用在辅助导航、自动驾驶上。在实际场景中,高铁在行驶过程中会面临一些极端情况,例如泥石流灾害、轨道脱轨等,对于这些极端情况通常采用图像识别的方式进行判断 。而图像识别算法的训练需要大量高质量的数据集,尤其是面向图像分割算法的语义分割标注数据,获取成本极高。
语义分割标注是对物体区域进行划分并分类,通常使用多边形标注的方式对各类物体轮廓进行标注。目前针对物体轮廓标注多边形的方式存在更为明显的效率低下问题,人工标注成本过高。为控制数据标注成本,提高人工标注物体轮廓效率是最直接有效的方法,设计实现一个高效率的数据标注工具十分关键。
今天就分享一篇我看到的关于数据标注的方法。
1 概述
略。
2 数据标注问题概述
略。
3 数据标注系统设计与实现
本章节提出提升人工标注物体轮廓效率的方法,并设计和实现一个数据标注系统。首先,进行数据标注系统的架构设计;然后,针对人工描点标注多边形操作繁多的问题,提出鼠标快速标注物体轮廓的方法,并应用到系统当中;最后,利用视频中帧连续的特性,进行整体拷贝 / 调整标注多边形方法的研究和应用。
3.1 系统架构
本标注系统采用 B/S 架构 [6],前端使用 React[7]框架,后端使用 Flask 框架 [8],前后端通信使用Axios 库和 SocketIO[9] 技术,采用前后端分离模式,采用关系型数据库 MySQL[10] 存储数据。前端即客户端主要包含 UI 层和业务逻辑层,UI 层负责界面展示和数据可视化,同时提供数据标注工作相关的交互功能,业务逻辑层负责实现前端标注操作的业务逻辑,处理数据变化,并提供与后端的通信的功能。后端即服务器端主要包含业务逻辑层和数据访问层,业务逻辑层提供接口给客户端,为客户端功能的实现提供业务逻辑处理,并集成图像分割算法模块,数据访问层控制对数据库的访问操作,为业务逻辑层提供增删改查方法。系统架构设计如图 1 所示。
3.2 鼠标快速标注方法设计
面向图像分割的数据标注系统能够支持使用多边形标注物体轮廓,目前纯人工标注多边形需要沿物体轮廓描点标记,对于物体轮廓较为复杂的情况,描点标记的难度和复杂度会成倍上升。为了方便描绘物