【计算机视觉】场景文本检测与识别(资料)

文字检测与识别资料整理(比心心心?)

Synthetic Word Dataset

合成文本识别数据集,包含9百万张图像,涵盖了9万个英语单词。文件大小为10GB

下载地址:http://www.robots.ox.ac.uk/~vgg/data/text/

 


Synthetic Data for Text Localisation

在复杂背景下人工合成的自然场景文本数据。包含858750张图像,共7266866个单词实例,28971487个字符,文件大小为41GB。该合成算法,不需要人工标注就可知道文字的label信息和位置信息,可得到大量自然场景文本标注数据。

下载地址:http://www.robots.ox.ac.uk/~vgg/data/scenetext/
文献:http://www.robots.ox.ac.uk/~ankush/textloc.pdf
Code: https://github.com/ankush-me/SynthText (英文版)
Code https://github.com/wang-tf/Chinese_OCR_synthetic_data(中文版)

 

Google FSNS(谷歌街景文本数据集)

该数据集是从谷歌法国街景图片上获得的一百多万张街道名字标志,每一张包含同一街道标志牌的不同视角,图像大小为600*150,训练集1044868张,验证集16150张,测试集20404张。

下载地址:http://rrc.cvc.uab.es/?ch=6&com=downloads
文献:http:// arxiv.org/pdf/1702.03970v1

 

COCO-TEXT

该数据集,包括63686幅图像,173589个文本实例,包括手写版和打印版,清晰版和非清晰版。文件大小12.58GB,训练集:43686张,测试集:10000张,验证集:10000张

文献: http://arxiv.org/pdf/1601.07140v2
下载地址:https://vision.cornell.edu/se3/coco-text-2/

 


ICDAR2015——Word Spotting(检测)、End-to-End(识别)

ICDAR2011——Word Spotting(检测)

SVT——Word Spotting(检测)

(以上三个数据集是英文的:Towards End-to-end Text Spotting with Convolutional Recurrent Neural Networks)


参考:

自然场景文本检测识别技术综述 - SIGAI的文章 - 知乎 

场景文本检测—CTPN算法介绍 - SIGAI的文章 - 知乎 

深入浅出了解OCR识别票据原理 - 腾讯云技术社区的文章 - 知乎 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值