深度学习第一步就是制作数据集,手动去标注一些数据。本文将介绍一些用于图像数据标注的软件。
1.Labelme
labelme是麻省理工(MIT)的计算机科学和人工智能实验室(CSAIL)研发的图像注释工具,它是用Python
和PyQT
编写的,用于图像标注。
- 对图像进行多边形,矩形,圆形,多段线,线段,点形式的标注(可用于目标检测,图像分割,等任务)。
- 对图像进行进行 flag 形式的标注(可用于图像分类和清理任务)。
- 视频标注
- 生成 VOC 格式的数据集
- 生成 COCO 格式的数据集
2.Labelimg
LabelImg是一款开源的图片标注工具,使用Python编写,基于PyQt5框架。它提供了一个直观的图形用户界面,方便用户对图片进行标注,并生成标注结果。LabelImg支持多种常见的标注格式,如PASCAL VOC、YOLO等,适用于各种计算机视觉任务。它可以用在Windows、Linux和macOS等多个平台上,并支持各种类型的图像文件格式,如JPG、PNG和BMP等。
3.roLabelimg
roLabelImg是基于labelImg改进的一款图像标注工具,主要用于标注为VOC格式的数据。与labelImg相比,roLabelImg在功能上有所增强,其中最显著的特点是支持标注框的旋转。这意味着用户不仅可以创建常规的矩形标注框,还可以根据需要调整标注框的方向,使其适应各种不规则形状的目标。
使用roLabelImg进行标注的过程与labelImg类似,用户可以通过直观的图形界面加载图像,创建和编辑标注框,并为每个标注框分配相应的类别标签。完成标注后,roLabelImg可以生成符合VOC格式要求的标注文件,供后续的计算机视觉任务使用。需要注意的是,在使用roLabelImg之前,需要先安装labelImg,因为roLabelImg是在labelImg的基础上进行改进的。此外,还需要安装PyQt5等依赖项,以确保roLabelImg能够正常运行。
4.AutoLabelimg
AutoLabelImg除了labelimg的初始功能外,额外包含十多种辅助标注功能,分别在Annoatate-tools和Video-tools两个新菜单栏下面,具体如下:
- 自动标注:基于yolov5的模型自动标注,将yolov5的检测结果转化为.xml标注文件
- 追踪标注:基于opencv的追踪模块实现的视频自动标注,标注开始的一帧,利用追踪预测后续的一段视频
- 放大镜:鼠标附近区域的放大展示,方便标注一些微小目标,放大镜功能可以选择开启或关闭
- 数据增强:随机使用平移,翻转,缩放,亮度,gama,模糊等手段增强图片
- 其他批量处理工具如:类别筛选/重命名/统计、标注文件属性校正、视频提取/合成、图片重命名等。
5.X-anyLabelimg
X-AnyLabeling 是一款全新的交互式自动标注工具,其基于AnyLabeling进行构建和二次开发,在此基础上扩展并支持了许多的模型和功能,并借助Segment Anything和YOLO等主流模型提供强大的 AI 支持。
- 支持多边形、矩形、圆形、直线和点的图像标注。
- 支持文本检测、识别和KIE(关键信息提取)标注。
- 支持检测-分类级联模型进行细粒度分类。
- 支持一键人脸和关键点检测功能。
- 支持转换成标准的COCO-JSON、VOC-XML以及YOLOv5-TXT文件格式。
- 提供先进的检测器,包括YOLOv5、YOLOv6、YOLOv7、YOLOv8、YOLOX以及DETR系列模型。
6.LabelTrack
LabelTrack是为多目标跟踪MOT写的一个自动标注工具,它可以通过导入视频流等操作完成快速的行人标注。
- 导入mp4文件或视频帧文件夹
- 手动标注修改标注框,包括大小,标签,ID等信息
- 采用SOTA目标跟踪模型对视频帧进行预跟踪
- 导出和导入VisDrone格式数据集
7.Plabel
这个工具是由鹏城实验室自主研发,集成视频抽帧,目标检测、视频跟踪、ReID分类、人脸检测等算法,实现了对图像,视频的自动标注,并可以对自动算法的结果进行人工标注,最终得到标注结果。 同时也可以对视频、图片、医疗(包括dicom文件及病理图像)相关的数据进行人工标注,标注结果支持COCO及VOC格式。支持多人协同标注。目前也新增新增基于GPU的Segment Anything分割自动标注镜像,可分割任意图片。