自然场景中文汉字数据集
本数据集包括3273类汉字,共47万张汉字图片,每类汉字归类在一个文件夹下,各图像尺寸不一,包含在自然场景下能见到的各种字体。
本人由于需要大量的自然场景中文汉字数据集,而手头只有少部分汉字数据集,但是如果自己生成汉字数据集,这数据集的汉字和我项目需要的自然场景汉字数据集并非同分布,在我自己的项目数据集下识别效果特别差。因此,从网上搜来大量标注的自然场景图片数据集,处理之后得到汉字数据集。使用这些汉字数据集进行训练之后,在我自己的项目数据上也能识别很好。
如需下载该数据集,请移步至:https://download.csdn.net/download/u011754972/11236720
[汉字数据集文件夹展示]:
[灰度图片展示]:
[灰度图片展示]:
[彩色图片展示]:
另附上自然场景下的特定场景下的汉字数据集,即,不包含自然场景下的手写体、过度扭曲图、以及艺术体,可以参考道路交通路标上的规范字体,此数据集包含2602类汉字,如需下载该数据集,请移步至:https://download.csdn.net/download/u011754972/11237131