运行如上命令后,系统就会自动下载labelimg相关的依赖。
五、使用labelimg
首先这里需要准备我们需要打标注的数据集。这里我建议新建一个名为VOCdevkit的文件夹(这个是约定俗成,后续代码划分需要),在里面再创建一个VOC2007的文件夹,然后在VOC2007文件夹里面创建一个名为JPEGImages的文件夹存放我们需要打标签的图片文件;;再创建一个名为Annotations存放标注的标签文件;最后创建一个名字为predefined_classes.txt 的txt文件来存放所要标注的类别名称。
首先在JPEGImages这个文件夹放置待标注的图片然后再 predefined_classes.txt 这个txt文档里面输入定义的类别种类;之后打开刚刚下载的labelimg,用pycharm打开运行一下就好了
下面介绍图中的我们常用的按钮。
Open Dir是待标注图片数据的路径文件夹,这里输入命令的时候就选定了JPEGImages。(当然这是可以换的)Change Save Dir保存类别标签的路径文件夹,这里我们选定了Annotations文件夹。
这个按键可以说明我们标注的标签为voc格式,点击可以换成yolo或者createML格式。
常用快捷键如下:
A:切换到上一张图片
D:切换到下一张图片
W:调出标注十字架
del :删除标注框框
Ctrl+u:选择标注的图片文件夹
Ctrl+r:选择标注好的label标签存在的文件夹
记得把Auto Save mode勾选上这样就不用手动保存了
开始标注
我们按快捷键w,然后选定我们需要标注的对象。按住鼠标左键拖出框框就可以了。如下图所示,当我们选定目标以后,就会加载出来predefined_classes.txt 定义自己要标注的所有类别(如果类别多,是真的很方便,就不需要自己手打每个类别的名字了)。然后界面最右边会出现打好的类别标签。打好一张照片以后,快捷键D,就会进入下一张,这时候就会自动保存标签文件(voc格式会保存xml,yolo会保存txt格式)。标签打完以后可以去Annotations 文件下看到标签文件已经保存在这个目录下。
自此labelimg使用讲解就结束了。
voc标签转txt,并且划分测试集和验证集
我们经常从网上获取一些目标检测的数据集资源标签的格式都是VOC(xml格式)的,而yolov5训练所需要的文件格式是yolo(txt格式)的,这里就需要对xml格式的标签文件转换为txt文件。同时训练自己的yolov5检测模型的时候,数据集需要划分为训练集和验证集。这里提供了一份代码将xml格式的标注文件转换为txt格式的标注文件,并按比例划分为训练集和验证集。这里要把这个代码文件和刚才创建的文件夹放在一起
import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join
import random
from shutil import copyfile
classes = ["hat", "person"]
#classes里面必须正确填写xml里面已经标注好的类,这里需要修改成自己的类
TRAIN_RATIO = 80 #TRAIN_RATIO是训练集和验证集的比例,当等于80的时候,说明划分80%给训练集,20%给验证集。
def clear_hidden_files(path):
dir_list = os.listdir(path)
for i in dir_list:
abspath = os.path.join(os.path.abspath(path), i)
if os.path.isfile(abspath):
if i.startswith("._"):
os.remove(abspath)
else:
clear_hidden_files(abspath)
def convert(size, box):
dw = 1./size[0]
dh = 1./size[1]
x = (box[0] + box[1])/2.0
y = (box[2] + box[3])/2.0
w = box[1] - box[0]
h = box[3] - box[2]
x = x*dw
w = w*dw
y = y*dh
h = h*dh
return (x,y,w,h)
def convert_annotation(image_id):
in_file = open('VOCdevkit/VOC2007/Annotations/%s.xml' %image_id)
out_file = open('VOCdevkit/VOC2007/YOLOLabels/%s.txt' %image_id, 'w')
tree=ET.parse(in_file)
root = tree.getroot()