CCPD数据集处理

借鉴某大佬,链接请点击, 目前写的没他好,用于自己做笔记, 请前往此链接给大佬点赞

import numpy as np
import cv2
import os
import glob
from tqdm import tqdm

words_list = [
    "A","B","C","D","E",
    "F","G","H","J","K",
    "L","M","N","P","Q",
    "R","S","T","U","V",
    "W","X","Y","Z","0",
    "1","2","3","4","5",
    "6","7","8","9"
]
 
con_list = [
    "皖", "沪", "津", "渝", "冀",
    "晋", "蒙", "辽", "吉", "黑",
    "苏", "浙", "京", "闽", "赣",
    "鲁", "豫", "鄂", "湘", "粤",
    "桂", "琼", "川", "贵", "云",
    "西", "陕", "甘", "青", "宁",
    "新"
]
 
 
def order_points(pts):
    # 初始化坐标点
    rect = np.zeros((4, 2), dtype='float32')
 
    # 获取左上角和右下角坐标点
    s = pts.sum(axis=1)  # 每行像素值进行相加;若axis=0,每列像素值相加
    rect[0] = pts[np.argmin(s)]  # top_left,返回s首个最小值索引,eg.[1,0,2,0],返回值为1
    rect[2] = pts[np.argmax(s)]  # bottom_left,返回s首个最大值索引,eg.[1,0,2,0],返回值为2
 
    # 分别计算左上角和右下角的离散差值
    diff = np.diff(pts, axis=1)  # 第i+1列减第i列
    rect[1] = pts[np.argmin(diff)]
    rect[3] = pts[np.argmax(diff)]
 
    return rect
 
 
def four_point_transform(image, pts):
    # 获取坐标点,并将它们分离开来
    rect = order_points(pts)
    (tl, tr, br, bl) = rect
    
    # 计算新图片的宽度值,选取水平差值的最大值
    widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))
    widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))
    maxWidth = max(int(widthA), int(widthB))
 
    # 计算新图片的高度值,选取垂直差值的最大值
    heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))
    heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))
    maxHeight = max(int(heightA), int(heightB))
 
    # 构建新图片的4个坐标点,左上角为原点
    dst = np.array([
        [0, 0],
        [maxWidth - 1, 0],
        [maxWidth - 1, maxHeight - 1],
        [0, maxHeight - 1]], dtype="float32")
 
    # 获取透视变换矩阵并应用它
    M = cv2.getPerspectiveTransform(rect, dst)
    # 进行透视变换
    warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight))
 
    # 返回变换后的结果
    return warped
 
if __name__ == "__main__":
    global points
    total = []
    for item in tqdm(glob.glob(os.path.join(r'E:\BaiduNetdiskDownload\CCPD2019\ccpd_base\*.jpg'))):
        img = cv2.imread(item)
        _, _, bbox, points, label, _, _ = item.split('-')
 
 
        points = points.split('_')
        tmp = points
        points = []
        for _ in tmp:
            points.append([int(_.split('&')[0]), int(_.split('&')[1])])
        #print(points)
 
        label = label.split('_')
        con = con_list[int(label[0])]
        words = [words_list[int(_)] for _ in label[1:]]
        label = con + ''.join(words)
        line = item + '\t' + label
        line = line[:] + '\n'
        total.append(line)
 
 
        # 还原像素位置
        points = np.array(points, dtype=np.float32)
        warped = four_point_transform(img, points)
        save_path = os.path.join(r'E:\BaiduNetdiskDownload\CCPD\base', os.path.basename(item))
        cv2.imwrite(save_path, warped)
 
    # with open('/civi/CCPD_Test/challenge_dataset/'+'train_dataset.txt', 'w', encoding='UTF-8') as f:
    #     for line in total:
    #         f.write(line)```

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 将CCPD数据集转换成VOC格式需要进行以下步骤: 1. 首先,我们需要将CCPD数据集中的图像和标注框信息加载到内存中。 2. 然后,创建一个VOC格式的文件夹结构,包括Annotations、ImageSets、JPEGImages、SegmentationClass和SegmentationObject等文件夹。 3. 遍历所有CCPD数据集的图像,将其复制到JPEGImages文件夹中,并将图像文件名保存到ImageSets/Main文件夹中的训练集(train.txt)和验证集(val.txt)中。 4. 对于每个图像,读取其对应的CCPD标注文件,并解析出车牌的位置信息和标签等。 5. 将解析出的车牌位置信息和标签等保存到Annotations文件夹中,每个图像对应一个XML文件。 6. 如果需要使用分割图像,将图像复制到SegmentationClass文件夹,并使用图像编辑软件手动绘制分割图像,将分割图像保存到SegmentationObject文件夹中。 7. 最后,将创建的文件夹结构打包成一个VOC格式的压缩文件,以便后续的使用。 以上是将CCPD数据集转换成VOC格式的大致步骤,具体转换过程中还需要注意标注文件的格式和内容的对应关系。同时,可以借助一些开源的数据集转换工具或脚本来简化转换过程。 ### 回答2: 将CCPD数据集转换成VOC格式可以通过以下步骤完成: 1. 解析CCPD数据集的标注文件:CCPD数据集的标注文件通常以JSON格式存储,其中包含每个图像的路径、车牌号码、车牌区域的坐标等信息。我们可以使用Python的json库来解析标注文件,提取所需的信息。 2. 创建VOC格式的标注文件:VOC格式的标注文件以XML格式存储,其中包含了图像的路径、尺寸信息以及每个目标物体的类别、边界框等。我们可以使用Python的xml.etree.ElementTree库来创建XML文件,并依照VOC格式的要求填充相应的字段。 3. 转换图像格式:CCPD数据集中的图像通常以JPEG格式存储。在转换成VOC格式时,需要将图像的格式转换为PNG或者JPEG,以便与VOC标注文件对应。 4. 保存转换后的文件:将转换后的VOC格式标注文件和图像保存在指定的文件夹中,以便后续使用。 值得注意的是,转换CCPD数据集为VOC格式时,需要根据具体的需求进行适当的调整。例如,可能需要手动调整车牌区域的坐标以适应VOC格式的要求,或者添加新的字段来记录车牌的颜色、字符等信息。 ### 回答3: 将CCPD数据集转换成VOC格式需要经过以下几个步骤: 1. 了解CCPD数据集的结构:CCPD数据集是用于车牌检测和识别的数据集,其中包含了大量车辆图像和对应的车牌信息。 2. 创建VOC格式的文件夹结构:VOC格式包括JPEGImages、Annotations、ImageSets三个文件夹。 3. 将CCPD数据集中的车辆图像复制到JPEGImages文件夹中:将CCPD数据集中的所有车辆图像文件复制到JPEGImages文件夹中。 4. 根据CCPD数据集中的车牌信息创建标注文件:对于每个图像,根据CCPD数据集中的车牌信息,创建一个XML文件,用于描述图像中的车牌位置和类别等信息。XML文件的格式遵循VOC的标准。 5. 将标注文件保存到Annotations文件夹中:将创建的XML文件保存到Annotations文件夹中。 6. 创建ImageSets文件夹,并在其中创建Main文件夹:创建一个名为Main的文件夹,并在其中创建train.txt、val.txt、test.txt等文件,用于记录训练集、验证集和测试集的图像文件名。 7. 将图片文件名写入对应的txt文件中:根据划分的训练集、验证集和测试集,将对应的图像文件名写入train.txt、val.txt、test.txt等文件中。 8. VOC格式的转换完成。 通过以上步骤,我们可以将CCPD数据集转换成VOC格式,使其可以与其他遵循VOC格式的数据集进行统一处理和使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

kui9702

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值