Chinese Text in the Wild (CTW data)
32,285 张图像和 1,018,402 个中文字符,来源于腾讯街景。图像大小2048*2048,数据集大小为31GB。
ICPR WTMI2018中文数据集(天池比赛数据集)
20000张图像。中英文混合。背景复杂。文件大小为2GB。
ICDAR数据集
ICDAR 2017 RCTW,主要是中文,共12263张图像。数据集绝大多数是相机拍的自然场景,一些是屏幕截图;包含了大多数场景,如室外街道、室内场景、手机截图等等
Reading Chinese Text in the Wild(RCTW-17)
该数据集包含12263张图像,训练集8034张,测试集4229张,共11.4GB。大部分图像由手机相机拍摄,含有少量的屏幕截图,图像中包含中文文本与少量英文文本。图像分辨率大小不等。
Chinese Text in the Wild(CTW)
主要包括3万多幅街景图像中注释的3850个独特的中文文本数据集,其中约有100万个汉字。具有良好的多样性,包括平面文本、凸起文本、弱光下文本、远处文本、部分遮挡文本等。
Total-Text
该数据集共1555张图像,11459文本行,包含水平文本,倾斜文本,弯曲文本。文件大小441MB。大部分为英文文本,少量中文文本。训练集:1255张 测试集:300
Caffe-ocr中文合成数据
数据利用中文语料库,通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成,共360万张图片,图像分辨率为280x32,涵盖了汉字、标点、英文、数字共5990个字符。文件大小约为8.6GB
Synthetic Data for Text Localisation
在复杂背景下人工合成的自然场景文本数据。包含858750张图像,共7266866个单词实例,28971487个字符,文件大小为41GB。
MSRA-TD500
包含500幅自然图像,这些图像是使用袖珍相机从室内(办公室和商场)和室外(街道)场景拍摄的。室内图像以标牌、门牌、警示牌为主,室外图像以复杂背景下的导板、广告牌为主。图像的分辨率从1296x864到1920x1280不等。文本有不同的语言(中文、英文或两者的混合)。
COCO-TEXT
该数据集,包括63686幅图像,173589个文本实例,包括手写版和打印版,清晰版和非清晰版。文件大小12.58GB
Google FSNS(谷歌街景文本数据集)
谷歌法国街景图片上获得的一百多万张街道名字标志
SynthText in the Wild dataset
一个综合生成的数据集,其中单词实例放置在自然场景图像中,同时考虑场景布局。数据集由大约80万个合成词实例的800万个图像组成。每个文本实例都使用其文本字符串、字级和字符级边界框进行注释。文件大小为41GB
Text in Videos
涵盖不同的脚本和语言(西班牙语、法语、英语)
The Uber Text dataset
包含了从车载传感器采集的街道级图像和由图像分析团队注释的Ground Truth
The Chars74K dataset
数据集介绍:
• 包括64类(0-9、A-Z、A-Z)
• 自然图像7705个字符
• 使用平板电脑绘制3410个手写字符
• 62992个计算机字体合成的字符
• 共提供了超过74K个图像(解释了数据集的名称)。
原文链接:https://blog.csdn.net/qq_33511693/java/article/details/105316987
Synthetic Word Dataset
合成文本识别数据集,包含9百万张图像,涵盖了9万个英语单词。文件大小为10GB
360万的中文数据训练集
一个项目数据集:360万的中文数据训练集,最后可以finetune到97.7%的验证准确率
https://github.com/Sierkinhane/crnn_chinese_characters_rec/tree/master/data_generator
https://blog.csdn.net/javastart/article/details/104069709