CCPD车牌数据集转换成yolo训练格式

CCPD数据集,主要是国内车牌的相关数据,本博客解决了如何转换为yolo训练的xml格式。

步骤两步:1. 重新命名图片
                  2. 生成对应的xml

本文只解决了识别车牌的问题,车牌里面文字识别没有解决!

图片的命名一般是以下格式:(CCPD2020数据集)
3061158854166666665-97_100-159&434_586&578-558&578_173&523_159&434_586&474-0_0_3_24_33_32_28_30-64-233.jpg

在这里159&434_586&578对应边界框左上角和右下角坐标:左上(159, 434), 右下(586, 578)

我们只需要提取这几个做坐标,然后把图片名字改成坐标,我这里所有的标签都是car_id

下面是代码,将图片名字重新命名改成坐标id

import os
dir_file=r'D:\work\deeplearning\data\car_id\CCPD2020\ccpd_green\train' #训练集train文件夹的位置
new_out1=r'D:\work\deeplearning\data\car_id\CCPD2020\ccpd_green\new_out' #新的文件夹用来保存输出的图片,自己建立一个新的
name=os.listdir(dir_file) #读取所有的图片名字
for i in name:
    file_=os.path.join(dir_file,i)
    parts = i.split("_")
    xy_min=parts[1].split('-')[1]
    x_min,y_min=xy_min.split('&')[0],xy_min.split('&')[1]
    xy_max=parts[2].split('-')[0]
    x_max,y_max=xy_max.split('&')[0],xy_max.split('&')[1]
    new_name=xy_min+'_'+xy_max+'.jpg'
    new_path=os.path.join(new_out1,new_name)
    os.rename(file_,new_path)

下面代码是生成每个图片对应的xml文件

import os
from xml.etree.ElementTree import Element, SubElement, ElementTree
import PIL.Image as PIL
dir=r'D:\work\deeplearning\data\car_id\CCPD2020\ccpd_green\new_out' #新生成图片的那个文件夹
dir_=r'D:\work\deeplearning\data\car_id\CCPD2020\ccpd_green\xml' #自己创建一个xml文件夹用来生成xml文件
name=os.listdir(dir)

for i in name:
    file_=os.path.join(dir,i)
    parts = i.split("_")
    xy_min=parts[0].split('&')
    x_min,y_min=xy_min[0],xy_min[1]
    xy_max=parts[1].split('.')[0]
    x_max,y_max=xy_max.split('&')[0],xy_max.split('&')[1]
    img=PIL.open(file_)
    image_width=img.size[0]
    image_height=img.size[1]
    image_depth = 3
    x1, y1, x2, y2 =x_min,y_min,x_max,y_max

    # 创建 XML 结构
    annotation = Element('annotation')
    SubElement(annotation, 'folder').text = 'Images'
    SubElement(annotation, 'filename').text = i
    SubElement(annotation, 'path').text = file_
    source = SubElement(annotation, 'source')
    SubElement(source, 'database').text = 'Unknown'
    size = SubElement(annotation, 'size')
    SubElement(size, 'width').text = str(image_width)
    SubElement(size, 'height').text = str(image_height)
    SubElement(size, 'depth').text = str(image_depth)
    SubElement(annotation, 'segmented').text = '0'
    obj = SubElement(annotation, 'object')
    SubElement(obj, 'name').text = 'car_id'   #这里可以改你想要的id
    SubElement(obj, 'pose').text = 'Unspecified'
    SubElement(obj, 'truncated').text = '0'
    SubElement(obj, 'difficult').text = '0'
    bndbox = SubElement(obj, 'bndbox')
    SubElement(bndbox, 'xmin').text = str(x1)
    SubElement(bndbox, 'ymin').text = str(y1)
    SubElement(bndbox, 'xmax').text = str(x2)
    SubElement(bndbox, 'ymax').text = str(y2)

    # 保存 XML 文件
    tree = ElementTree(annotation)
    tree.write(dir_+'/'+i.split('.')[0]+'.xml', encoding='utf-8') 

下面是xml和img,知道你们懒都想白嫖

夸克网盘
链接:https://pan.quark.cn/s/7f12e2c00a7d
提取码:vEa4

xml文件通用性很强,转换coco 还是yolo官方训练数据集都有一大堆教学,自己搜一下就好了

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 将CCPD数据集转换成VOC格式需要进行以下步骤: 1. 首先,我们需要将CCPD数据集中的图像和标注框信息加载到内存中。 2. 然后,创建一个VOC格式的文件夹结构,包括Annotations、ImageSets、JPEGImages、SegmentationClass和SegmentationObject等文件夹。 3. 遍历所有CCPD数据集的图像,将其复制到JPEGImages文件夹中,并将图像文件名保存到ImageSets/Main文件夹中的训练集(train.txt)和验证集(val.txt)中。 4. 对于每个图像,读取其对应的CCPD标注文件,并解析出车牌的位置信息和标签等。 5. 将解析出的车牌位置信息和标签等保存到Annotations文件夹中,每个图像对应一个XML文件。 6. 如果需要使用分割图像,将图像复制到SegmentationClass文件夹,并使用图像编辑软件手动绘制分割图像,将分割图像保存到SegmentationObject文件夹中。 7. 最后,将创建的文件夹结构打包成一个VOC格式的压缩文件,以便后续的使用。 以上是将CCPD数据集转换成VOC格式的大致步骤,具体转换过程中还需要注意标注文件的格式和内容的对应关系。同时,可以借助一些开源的数据集转换工具或脚本来简化转换过程。 ### 回答2: 将CCPD数据集转换成VOC格式可以通过以下步骤完成: 1. 解析CCPD数据集的标注文件:CCPD数据集的标注文件通常以JSON格式存储,其中包含每个图像的路径、车牌号码、车牌区域的坐标等信息。我们可以使用Python的json库来解析标注文件,提取所需的信息。 2. 创建VOC格式的标注文件:VOC格式的标注文件以XML格式存储,其中包含了图像的路径、尺寸信息以及每个目标物体的类别、边界框等。我们可以使用Python的xml.etree.ElementTree库来创建XML文件,并依照VOC格式的要求填充相应的字段。 3. 转换图像格式CCPD数据集中的图像通常以JPEG格式存储。在转换成VOC格式时,需要将图像的格式转换为PNG或者JPEG,以便与VOC标注文件对应。 4. 保存转换后的文件:将转换后的VOC格式标注文件和图像保存在指定的文件夹中,以便后续使用。 值得注意的是,转换CCPD数据集为VOC格式时,需要根据具体的需求进行适当的调整。例如,可能需要手动调整车牌区域的坐标以适应VOC格式的要求,或者添加新的字段来记录车牌的颜色、字符等信息。 ### 回答3: 将CCPD数据集转换成VOC格式需要经过以下几个步骤: 1. 了解CCPD数据集的结构:CCPD数据集是用于车牌检测和识别的数据集,其中包含了大量车辆图像和对应的车牌信息。 2. 创建VOC格式的文件夹结构:VOC格式包括JPEGImages、Annotations、ImageSets三个文件夹。 3. 将CCPD数据集中的车辆图像复制到JPEGImages文件夹中:将CCPD数据集中的所有车辆图像文件复制到JPEGImages文件夹中。 4. 根据CCPD数据集中的车牌信息创建标注文件:对于每个图像,根据CCPD数据集中的车牌信息,创建一个XML文件,用于描述图像中的车牌位置和类别等信息。XML文件的格式遵循VOC的标准。 5. 将标注文件保存到Annotations文件夹中:将创建的XML文件保存到Annotations文件夹中。 6. 创建ImageSets文件夹,并在其中创建Main文件夹:创建一个名为Main的文件夹,并在其中创建train.txt、val.txt、test.txt等文件,用于记录训练集、验证集和测试集的图像文件名。 7. 将图片文件名写入对应的txt文件中:根据划分的训练集、验证集和测试集,将对应的图像文件名写入train.txt、val.txt、test.txt等文件中。 8. VOC格式的转换完成。 通过以上步骤,我们可以将CCPD数据集转换成VOC格式,使其可以与其他遵循VOC格式数据集进行统一处理和使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值