使用labelimg进行图像标注，获得yolov所需数据集/xml标注文件转yolov5txt 脚本

工控90

已于 2022-11-08 18:14:06 修改

阅读量1.1k

点赞数 3

文章标签： python 深度学习人工智能

于 2022-11-08 16:19:31 首次发布

本文链接：https://blog.csdn.net/yezlin/article/details/127753030

版权

使用labelimg进行图像标注，获得yolov所需数据集

通过pip install labelImg命令来安装labelImg，安装后命令行labelimg直接打开使用
pip默认是从国外网站上下载要安装的工具包，通常会因为网络错误等原因导致下载失败。
为了避免下载失败，我们将pip的镜像源切换为国内的镜像源。

国内常用镜像源：
阿里云：https://mirrors.aliyun.com/pypi/simple
清华：https://pypi.tuna.tsinghua.edu.cn/simple
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
豆瓣：http://pypi.douban.com/simple/

镜像源的切换有如下的一些方式：
临时切换：
pip install -i 镜像源包名，例如： pip install -i https://mirrors.aliyun.com/pypi/simple labelImg
永久切换：
方式1：pip config set global.index-url + 源地址。
例如：pip config set global.index-url https://mirrors.aliyun.com/pypi/simple

标注方法
labelImg安装成功后在控制台输入labelImg可启动labelImg工具。

点击“Change Save Dir”按钮设置将标注结果存在指定的目录下。
点击“Create\nRectBox”按钮后开始标注。
按住Ctrl+鼠标滚轮，放大缩小图片。
“View”菜单点击“Auto Save Mode”可实现标注的自动保存，文件名和图片名一致。
对已标注的图，点击矩形框的4个顶点拖拽鼠标可对标注结果调整
标注要注意以下几点，会影响训练的效果：

针对图片中存在多个物体的情形，做到不重标、不漏标。
需要保证目标框内物体的完整性；要注意将属于该物体的部分都框进去，不属于的部分不框进去。
标注时将图像放大标，可确保目标框内的完整性。
活用快捷键。
注意保存格式从PascalVOC切换为YOLO后，只会将接下来标注的图保存为YOLO格式，已经保存为PascalVOC修改的图是不会自动切换为YOLO格式的。

说明：可通过labelimg自主标注获得yolov数据集 .txt文件
若有其他公开数据集或资源，一般标注后保存的是xml格式文件，可利用python脚本进行txt转换
脚本如下：

修改脚本中的类别，xml文件路径和输出.txt文件路径即可

import xml.etree.ElementTree as ET
import os
# 类别
CLASSES=["mask", "wrongmask", "nomask"]
# xml文件路径
xml_input="C:\\Users\\Desktop\\yolov5\\maskdataset\\label\\"
def convert(size,box):
    # 将bbox的左上角点，右下角点坐标的格式，转换为bbox中心点+bbox的W,H的格式，并进行归一化
    dw=1./size[0]
    dh=1./size[1]
    x=(box[0]+box[1])/2.0
    y=(box[2]+box[3])/2.0
    w=box[1]-box[0]
    h=box[3]-box[2]
    x=x*dw
    w=w*dw
    y=y*dh
    h=h*dh
    return (x,y,w,h)
def convert_annotation(image_id):
    # 把图像image_id的xml文件转换为目标检测的label文件(txt)
    # 其中包含物体的类别cls,bbox的中心点坐标,以及bbox的W,H
    # 并将四个物理量归一化
    in_file=open(xml_input+image_id,'r',encoding='utf-8')
    image_id=image_id.split(".")[0]
    print(image_id)
    out_file=open("C:\\Users\\Desktop\\yolov5\\maskdataset\\label1\\%s.txt"%(image_id),"w")
    #print(in_file)
    tree=ET.parse(in_file)
    root=tree.getroot()
    size=root.find("size")
    w=int(size.find("width").text)
    h=int(size.find("height").text)
    for obj in root.iter("object"):

        #difficult = obj.find("difficult").text
        difficult = 0;

        #print(difficult)
        obj_cls=obj.find("name").text
        if obj_cls not in CLASSES or int(difficult)==1:
            continue
        cls_id=CLASSES.index(obj_cls)
        xmlbox=obj.find("bndbox")
        points=(float(xmlbox.find("xmin").text),
                float(xmlbox.find("xmax").text),
                float(xmlbox.find("ymin").text),
                float(xmlbox.find("ymax").text))
        bb=convert((w,h),points)
        out_file.write(str(cls_id)+" "+" ".join([str(a) for a in bb])+"\n")
def make_label_txt():
    # labels文件夹下创建image_id.txt
    # 对应每个image_id.xml提取出的bbox信息
    filenames=os.listdir(xml_input)
    #print(filenames)
    for file in filenames:
       # print(file)
        convert_annotation(file)

if __name__=="__main__":
    # 开始提取和转换
    make_label_txt()

工控90

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
使用labelimg进行图像标注，获得yolov所需数据集/xml标注文件转yolov5txt 脚本

pip install -i 镜像源包名，例如： pip install -i https://mirrors.aliyun.com/pypi/simple labelImg。注意保存格式从PascalVOC切换为YOLO后，只会将接下来标注的图保存为YOLO格式，已经保存为PascalVOC修改的图是不会自动切换为YOLO格式的。例如：pip config set global.index-url https://mirrors.aliyun.com/pypi/simple。
复制链接

扫一扫