CCPD数据集,主要是国内车牌的相关数据,本博客解决了如何转换为yolo训练的xml格式。
步骤两步:1. 重新命名图片
2. 生成对应的xml
本文只解决了识别车牌的问题,车牌里面文字识别没有解决!
图片的命名一般是以下格式:(CCPD2020数据集)
3061158854166666665-97_100-159&434_586&578-558&578_173&523_159&434_586&474-0_0_3_24_33_32_28_30-64-233.jpg
在这里159&434_586&578对应边界框左上角和右下角坐标:左上(159, 434), 右下(586, 578)
我们只需要提取这几个做坐标,然后把图片名字改成坐标,我这里所有的标签都是car_id
下面是代码,将图片名字重新命名改成坐标id
import os
dir_file=r'D:\work\deeplearning\data\car_id\CCPD2020\ccpd_green\train' #训练集train文件夹的位置
new_out1=r'D:\work\deeplearning\data\car_id\CCPD2020\ccpd_green\new_out' #新的文件夹用来保存输出的图片,自己建立一个新的
name=os.listdir(dir_file) #读取所有的图片名字
for i in name:
file_=os.path.join(dir_file,i)
parts = i.split("_")
xy_min=parts[1].split('-')[1]
x_min,y_min=xy_min.split('&')[0],xy_min.split('&')[1]
xy_max=parts[2].split('-')[0]
x_max,y_max=xy_max.split('&')[0],xy_max.split('&')[1]
new_name=xy_min+'_'+xy_max+'.jpg'
new_path=os.path.join(new_out1,new_name)
os.rename(file_,new_path)
下面代码是生成每个图片对应的xml文件
import os
from xml.etree.ElementTree import Element, SubElement, ElementTree
import PIL.Image as PIL
dir=r'D:\work\deeplearning\data\car_id\CCPD2020\ccpd_green\new_out' #新生成图片的那个文件夹
dir_=r'D:\work\deeplearning\data\car_id\CCPD2020\ccpd_green\xml' #自己创建一个xml文件夹用来生成xml文件
name=os.listdir(dir)
for i in name:
file_=os.path.join(dir,i)
parts = i.split("_")
xy_min=parts[0].split('&')
x_min,y_min=xy_min[0],xy_min[1]
xy_max=parts[1].split('.')[0]
x_max,y_max=xy_max.split('&')[0],xy_max.split('&')[1]
img=PIL.open(file_)
image_width=img.size[0]
image_height=img.size[1]
image_depth = 3
x1, y1, x2, y2 =x_min,y_min,x_max,y_max
# 创建 XML 结构
annotation = Element('annotation')
SubElement(annotation, 'folder').text = 'Images'
SubElement(annotation, 'filename').text = i
SubElement(annotation, 'path').text = file_
source = SubElement(annotation, 'source')
SubElement(source, 'database').text = 'Unknown'
size = SubElement(annotation, 'size')
SubElement(size, 'width').text = str(image_width)
SubElement(size, 'height').text = str(image_height)
SubElement(size, 'depth').text = str(image_depth)
SubElement(annotation, 'segmented').text = '0'
obj = SubElement(annotation, 'object')
SubElement(obj, 'name').text = 'car_id' #这里可以改你想要的id
SubElement(obj, 'pose').text = 'Unspecified'
SubElement(obj, 'truncated').text = '0'
SubElement(obj, 'difficult').text = '0'
bndbox = SubElement(obj, 'bndbox')
SubElement(bndbox, 'xmin').text = str(x1)
SubElement(bndbox, 'ymin').text = str(y1)
SubElement(bndbox, 'xmax').text = str(x2)
SubElement(bndbox, 'ymax').text = str(y2)
# 保存 XML 文件
tree = ElementTree(annotation)
tree.write(dir_+'/'+i.split('.')[0]+'.xml', encoding='utf-8')
下面是xml和img,知道你们懒都想白嫖
夸克网盘
链接:https://pan.quark.cn/s/7f12e2c00a7d
提取码:vEa4
xml文件通用性很强,转换coco 还是yolo官方训练数据集都有一大堆教学,自己搜一下就好了