文字检测与识别资料整理(比心心心?)
Synthetic Word Dataset
合成文本识别数据集,包含9百万张图像,涵盖了9万个英语单词。文件大小为10GB
下载地址:http://www.robots.ox.ac.uk/~vgg/data/text/
Synthetic Data for Text Localisation
在复杂背景下人工合成的自然场景文本数据。包含858750张图像,共7266866个单词实例,28971487个字符,文件大小为41GB。该合成算法,不需要人工标注就可知道文字的label信息和位置信息,可得到大量自然场景文本标注数据。
下载地址:http://www.robots.ox.ac.uk/~vgg/data/scenetext/
文献:http://www.robots.ox.ac.uk/~ankush/textloc.pdf
Code: https://github.com/ankush-me/SynthText (英文版)
Code https://github.com/wang-tf/Chinese_OCR_synthetic_data(中文版)
Google FSNS(谷歌街景文本数据集)
该数据集是从谷歌法国街景图片上获得的一百多万张街道名字标志,每一张包含同一街道标志牌的不同视角,图像大小为600*150,训练集1044868张,验证集16150张,测试集20404张。
下载地址:http://rrc.cvc.uab.es/?ch=6&com=downloads
文献:http:// arxiv.org/pdf/1702.03970v1
COCO-TEXT
该数据集,包括63686幅图像,173589个文本实例,包括手写版和打印版,清晰版和非清晰版。文件大小12.58GB,训练集:43686张,测试集:10000张,验证集:10000张
文献: http://arxiv.org/pdf/1601.07140v2
下载地址:https://vision.cornell.edu/se3/coco-text-2/
ICDAR2015——Word Spotting(检测)、End-to-End(识别)
ICDAR2011——Word Spotting(检测)
SVT——Word Spotting(检测)
(以上三个数据集是英文的:Towards End-to-end Text Spotting with Convolutional Recurrent Neural Networks)
参考:
自然场景文本检测识别技术综述 - SIGAI的文章 - 知乎
场景文本检测—CTPN算法介绍 - SIGAI的文章 - 知乎
深入浅出了解OCR识别票据原理 - 腾讯云技术社区的文章 - 知乎