CCPD车牌数据集转换成yolo训练格式

最新推荐文章于 2024-08-05 11:19:50 发布

没有人辅导的研究生

最新推荐文章于 2024-08-05 11:19:50 发布

阅读量1.1k

点赞数 10

文章标签： YOLO 深度学习人工智能

本文链接：https://blog.csdn.net/hyj6668/article/details/137028611

版权

CCPD数据集，主要是国内车牌的相关数据，本博客解决了如何转换为yolo训练的xml格式。

步骤两步：1. 重新命名图片
2. 生成对应的xml

本文只解决了识别车牌的问题，车牌里面文字识别没有解决！

图片的命名一般是以下格式：（CCPD2020数据集）
3061158854166666665-97_100-159&434_586&578-558&578_173&523_159&434_586&474-0_0_3_24_33_32_28_30-64-233.jpg

在这里159&434_586&578对应边界框左上角和右下角坐标:左上(159, 434), 右下(586, 578)

我们只需要提取这几个做坐标，然后把图片名字改成坐标，我这里所有的标签都是car_id

下面是代码，将图片名字重新命名改成坐标id

import os
dir_file=r'D:\work\deeplearning\data\car_id\CCPD2020\ccpd_green\train' #训练集train文件夹的位置
new_out1=r'D:\work\deeplearning\data\car_id\CCPD2020\ccpd_green\new_out' #新的文件夹用来保存输出的图片，自己建立一个新的
name=os.listdir(dir_file) #读取所有的图片名字
for i in name:
    file_=os.path.join(dir_file,i)
    parts = i.split("_")
    xy_min=parts[1].split('-')[1]
    x_min,y_min=xy_min.split('&')[0],xy_min.split('&')[1]
    xy_max=parts[2].split('-')[0]
    x_max,y_max=xy_max.split('&')[0],xy_max.split('&')[1]
    new_name=xy_min+'_'+xy_max+'.jpg'
    new_path=os.path.join(new_out1,new_name)
    os.rename(file_,new_path)

下面代码是生成每个图片对应的xml文件

import os
from xml.etree.ElementTree import Element, SubElement, ElementTree
import PIL.Image as PIL
dir=r'D:\work\deeplearning\data\car_id\CCPD2020\ccpd_green\new_out' #新生成图片的那个文件夹
dir_=r'D:\work\deeplearning\data\car_id\CCPD2020\ccpd_green\xml' #自己创建一个xml文件夹用来生成xml文件
name=os.listdir(dir)

for i in name:
    file_=os.path.join(dir,i)
    parts = i.split("_")
    xy_min=parts[0].split('&')
    x_min,y_min=xy_min[0],xy_min[1]
    xy_max=parts[1].split('.')[0]
    x_max,y_max=xy_max.split('&')[0],xy_max.split('&')[1]
    img=PIL.open(file_)
    image_width=img.size[0]
    image_height=img.size[1]
    image_depth = 3
    x1, y1, x2, y2 =x_min,y_min,x_max,y_max

    # 创建 XML 结构
    annotation = Element('annotation')
    SubElement(annotation, 'folder').text = 'Images'
    SubElement(annotation, 'filename').text = i
    SubElement(annotation, 'path').text = file_
    source = SubElement(annotation, 'source')
    SubElement(source, 'database').text = 'Unknown'
    size = SubElement(annotation, 'size')
    SubElement(size, 'width').text = str(image_width)
    SubElement(size, 'height').text = str(image_height)
    SubElement(size, 'depth').text = str(image_depth)
    SubElement(annotation, 'segmented').text = '0'
    obj = SubElement(annotation, 'object')
    SubElement(obj, 'name').text = 'car_id'   #这里可以改你想要的id
    SubElement(obj, 'pose').text = 'Unspecified'
    SubElement(obj, 'truncated').text = '0'
    SubElement(obj, 'difficult').text = '0'
    bndbox = SubElement(obj, 'bndbox')
    SubElement(bndbox, 'xmin').text = str(x1)
    SubElement(bndbox, 'ymin').text = str(y1)
    SubElement(bndbox, 'xmax').text = str(x2)
    SubElement(bndbox, 'ymax').text = str(y2)

    # 保存 XML 文件
    tree = ElementTree(annotation)
    tree.write(dir_+'/'+i.split('.')[0]+'.xml', encoding='utf-8')

下面是xml和img，知道你们懒都想白嫖

夸克网盘
链接：https://pan.quark.cn/s/7f12e2c00a7d
提取码：vEa4

xml文件通用性很强，转换coco 还是yolo官方训练数据集都有一大堆教学，自己搜一下就好了