【计算机视觉】场景文本检测与识别（资料）

最新推荐文章于 2024-08-10 07:34:39 发布

sdbhewfoqi

最新推荐文章于 2024-08-10 07:34:39 发布

阅读量1.7k

点赞数 3

分类专栏：计算机视觉

本文链接：https://blog.csdn.net/weixin_31866177/article/details/88661262

版权

计算机视觉专栏收录该内容

44 篇文章 10 订阅

订阅专栏

文字检测与识别资料整理（比心心心?）

Synthetic Word Dataset

合成文本识别数据集，包含9百万张图像，涵盖了9万个英语单词。文件大小为10GB

下载地址：http://www.robots.ox.ac.uk/~vgg/data/text/

Synthetic Data for Text Localisation

在复杂背景下人工合成的自然场景文本数据。包含858750张图像，共7266866个单词实例，28971487个字符，文件大小为41GB。该合成算法，不需要人工标注就可知道文字的label信息和位置信息，可得到大量自然场景文本标注数据。

下载地址：http://www.robots.ox.ac.uk/~vgg/data/scenetext/
文献：http://www.robots.ox.ac.uk/~ankush/textloc.pdf
Code: https://github.com/ankush-me/SynthText (英文版)
Code https://github.com/wang-tf/Chinese_OCR_synthetic_data(中文版)

Google FSNS(谷歌街景文本数据集)

该数据集是从谷歌法国街景图片上获得的一百多万张街道名字标志，每一张包含同一街道标志牌的不同视角，图像大小为600*150，训练集1044868张，验证集16150张，测试集20404张。

下载地址：http://rrc.cvc.uab.es/?ch=6&com=downloads
文献：http:// arxiv.org/pdf/1702.03970v1

COCO-TEXT

该数据集，包括63686幅图像，173589个文本实例，包括手写版和打印版，清晰版和非清晰版。文件大小12.58GB，训练集：43686张，测试集：10000张，验证集：10000张

文献: http://arxiv.org/pdf/1601.07140v2
下载地址：https://vision.cornell.edu/se3/coco-text-2/

ICDAR2015——Word Spotting（检测）、End-to-End（识别）

ICDAR2011——Word Spotting（检测）

SVT——Word Spotting（检测）

（以上三个数据集是英文的：Towards End-to-end Text Spotting with Convolutional Recurrent Neural Networks）

参考：

自然场景文本检测识别技术综述 - SIGAI的文章 - 知乎

场景文本检测—CTPN算法介绍 - SIGAI的文章 - 知乎

深入浅出了解OCR识别票据原理 - 腾讯云技术社区的文章 - 知乎

sdbhewfoqi

关注

3
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录