CCPD2019车牌提取和字符提取

CCPD2019车牌提取和字符提取

最近有进行车牌识别的需要,故处理了CCPD2019的数据集,提取了车牌和数字字母汉字的字符。

一、CCPD数据集

关于CCPD的介绍可参考如下文章
CCPD车牌数据集介绍

二、提取数据集介绍

1、文件夹结构

plate_dataset
|	ccpd
|	|	ccpd_char_bin
|	|	|	pictures...
|	|	ccpd_char_bin_selected
|	|	|	pictures...
|	|	ccpd_char_init
|	|	|	pictures...
|	|	plate_dataset_all
|	|	|	pictures...
|	|	plate_dataset_nowan
|	|	|	pictures...
|	|	plate_dataset_wan
|	|	|	pictures...
|	|	plate_dataset_all.txt
|	|	plate_dataset_nowan.txt
|	|	plate_dataset_wan.txt
|	ccpd&others_chinese_char
|	|	ccpd和其他地方收集的汉字字符
|	others_chinese_char
|	|	其他地方收集的汉字字符

2、文件夹介绍

  1. ccpd文件夹中有6个文件夹和3个txt文件,下图为ccpd文件夹内容
    ccpd文件夹内容
    • ccpd_char_bin:未筛选过的二值化字符图片,下图为ccpdccpd_char_bin文件夹内容,ccpd_char_bin_selected和ccpd_char_init结构同样。其中图片命名方式和CCPD原始相同,只是在最后加上了类似“-1”的数字,表示为当前车牌第几位字符。
      ccpd_char_bin文件夹内容
    • ccpd_char_bin_selected:筛选过的二值化字符图片,剔除了图片中分割不好的部分图片,比如类似全白或者全黑的那种
    • ccpd_char_init:未筛选过的原始字符图片
    • plate_dataset_all:CCPD2019中的所有车牌照片,按照数据集中所给车牌区域分割,并进行了透视变换,让车牌正向显示
    • plate_dataset_nowan:不包含安徽的车牌照片,数量是8185张
    • plate_dataset_wan:只有安徽的车牌照片,数量是191811张
    • plate_dataset_all.txt
    • plate_dataset_nowan.txt
    • plate_dataset_wan.txt
      • 3个txt文件都是对应的文件夹下图片名称,格式为
        00260416666667-90_87-377&340_480&375-470&377_376&371_378&339_472&345-1_0_32_32_4_32_25-122-14.jpg \t 沪A88E81 \n
  2. 其余两个文件夹内容如结构展示部分所述

注意
3. 不论筛选还是未筛选的字符图片都不是CCPD所有的,因为我的程序对一些照片分割不出7个字符,这些分割不出7个字符的车牌我就没进行提取,还有比如汉字“皖”数量过多,也没有全部提取,有部分数字也是如此。
4. 汉字的提取结果很不理想,不仅数量少,而且大多是糊成一团。数字字母结果还可以。

3、样例与数量

未筛选字符样例与数量

在这里插入图片描述
各字符数量
[(‘0’, 34879), (‘1’, 30618), (‘2’, 32489), (‘3’, 29370), (‘4’, 15358), (‘5’, 31700), (‘6’, 35521), (‘7’, 31728), (‘8’, 36052), (‘9’, 35585), (‘A’, 86173), (‘B’, 7647), (‘C’, 9163), (‘D’, 8430), (‘E’, 6977), (‘F’, 7797), (‘G’, 7568), (‘H’, 9235), (‘J’, 8100), (‘K’, 7376), (‘L’, 9261), (‘M’, 8332), (‘N’, 7689), (‘P’, 6431), (‘Q’, 5764), (‘R’, 6960), (‘S’, 8487), (‘T’, 7057), (‘U’, 6055), (‘V’, 6380), (‘W’, 8117), (‘X’, 8543), (‘Y’, 9181), (‘Z’, 8436), (‘zh_cuan’, 25), (‘zh_e’, 232), (‘zh_gan’, 129), (‘zh_gan1’, 15), (‘zh_gui’, 15), (‘zh_gui1’, 9), (‘zh_hei’, 17), (‘zh_hu’, 432), (‘zh_ji’, 149), (‘zh_jin’, 50), (‘zh_jing’, 251), (‘zh_jl’, 11), (‘zh_liao’, 46), (‘zh_lu’, 209), (‘zh_meng’, 15), (‘zh_min’, 169), (‘zh_ning’, 4), (‘zh_qing’, 9), (‘zh_qiong’, 9), (‘zh_shan’, 46), (‘zh_su’, 2668), (‘zh_sx’, 55), (‘zh_wan’, 3121), (‘zh_xiang’, 83), (‘zh_xin’, 9), (‘zh_yu’, 385), (‘zh_yu1’, 54), (‘zh_yue’, 290), (‘zh_yun’, 15), (‘zh_zang’, 1), (‘zh_zhe’, 1096)]

筛选后字符样例与数量

在这里插入图片描述
各字符数量
[(‘0’, 34352), (‘1’, 30226), (‘2’, 31980), (‘3’, 28713), (‘4’, 14891), (‘5’, 30951), (‘6’, 34775), (‘7’, 31291), (‘8’, 35385), (‘9’, 35022), (‘A’, 84816), (‘B’, 7493), (‘C’, 8992), (‘D’, 8323), (‘E’, 6863), (‘F’, 7651), (‘G’, 7300), (‘H’, 9098), (‘J’, 7989), (‘K’, 7154), (‘L’, 9083), (‘M’, 8162), (‘N’, 7510), (‘P’, 6362), (‘Q’, 4908), (‘R’, 6801), (‘S’, 8295), (‘T’, 6928), (‘U’, 5994), (‘V’, 6296), (‘W’, 5040), (‘X’, 8422), (‘Y’, 9092), (‘Z’, 8218), (‘zh_cuan’, 13), (‘zh_e’, 122), (‘zh_gan’, 52), (‘zh_gan1’, 15), (‘zh_gui’, 5), (‘zh_gui1’, 4), (‘zh_hei’, 6), (‘zh_hu’, 282), (‘zh_ji’, 65), (‘zh_jin’, 32), (‘zh_jing’, 195), (‘zh_jl’, 10), (‘zh_liao’, 46), (‘zh_lu’, 79), (‘zh_meng’, 10), (‘zh_min’, 119), (‘zh_ning’, 4), (‘zh_qing’, 6), (‘zh_qiong’, 9), (‘zh_shan’, 41), (‘zh_su’, 2498), (‘zh_sx’, 42), (‘zh_wan’, 2924), (‘zh_xiang’, 69), (‘zh_xin’, 9), (‘zh_yu’, 355), (‘zh_yu1’, 49), (‘zh_yue’, 281), (‘zh_yun’, 15), (‘zh_zang’, 1), (‘zh_zhe’, 1026)]

三、下载

在这里插入图片描述
我把数据集分为了7个压缩包,只有part1需要积分,七个需要全部下载同时解压才可以使用。
part1
part2
part3
part4
part5
part6
part7

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值