ocr常用数据集介绍

最新推荐文章于 2024-06-05 14:49:34 发布

瑶光light

最新推荐文章于 2024-06-05 14:49:34 发布

阅读量3.1k

点赞数 1

分类专栏： cv 文章标签： ocr

原文链接：https://blog.csdn.net/javastart/article/details/104069709

版权

cv 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Chinese Text in the Wild (CTW data)

32,285 张图像和 1,018,402 个中文字符，来源于腾讯街景。图像大小2048*2048，数据集大小为31GB。
ICPR WTMI2018中文数据集（天池比赛数据集）
20000张图像。中英文混合。背景复杂。文件大小为2GB。
ICDAR数据集
ICDAR 2017 RCTW，主要是中文，共12263张图像。数据集绝大多数是相机拍的自然场景，一些是屏幕截图；包含了大多数场景，如室外街道、室内场景、手机截图等等

Reading Chinese Text in the Wild(RCTW-17)

该数据集包含12263张图像，训练集8034张，测试集4229张，共11.4GB。大部分图像由手机相机拍摄，含有少量的屏幕截图，图像中包含中文文本与少量英文文本。图像分辨率大小不等。

Chinese Text in the Wild(CTW)

主要包括3万多幅街景图像中注释的3850个独特的中文文本数据集，其中约有100万个汉字。具有良好的多样性，包括平面文本、凸起文本、弱光下文本、远处文本、部分遮挡文本等。

Total-Text

该数据集共1555张图像，11459文本行，包含水平文本，倾斜文本，弯曲文本。文件大小441MB。大部分为英文文本，少量中文文本。训练集：1255张测试集：300

Caffe-ocr中文合成数据

数据利用中文语料库，通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成，共360万张图片，图像分辨率为280x32，涵盖了汉字、标点、英文、数字共5990个字符。文件大小约为8.6GB

Synthetic Data for Text Localisation

在复杂背景下人工合成的自然场景文本数据。包含858750张图像，共7266866个单词实例，28971487个字符，文件大小为41GB。

MSRA-TD500

包含500幅自然图像，这些图像是使用袖珍相机从室内（办公室和商场）和室外（街道）场景拍摄的。室内图像以标牌、门牌、警示牌为主，室外图像以复杂背景下的导板、广告牌为主。图像的分辨率从1296x864到1920x1280不等。文本有不同的语言（中文、英文或两者的混合）。

COCO-TEXT

该数据集，包括63686幅图像，173589个文本实例，包括手写版和打印版，清晰版和非清晰版。文件大小12.58GB

Google FSNS(谷歌街景文本数据集)

谷歌法国街景图片上获得的一百多万张街道名字标志

SynthText in the Wild dataset

一个综合生成的数据集，其中单词实例放置在自然场景图像中，同时考虑场景布局。数据集由大约80万个合成词实例的800万个图像组成。每个文本实例都使用其文本字符串、字级和字符级边界框进行注释。文件大小为41GB

Text in Videos

涵盖不同的脚本和语言（西班牙语、法语、英语）

The Uber Text dataset

包含了从车载传感器采集的街道级图像和由图像分析团队注释的Ground Truth

The Chars74K dataset

数据集介绍：
• 包括64类（0-9、A-Z、A-Z）
• 自然图像7705个字符
• 使用平板电脑绘制3410个手写字符
• 62992个计算机字体合成的字符
• 共提供了超过74K个图像（解释了数据集的名称）。

原文链接：https://blog.csdn.net/qq_33511693/java/article/details/105316987

Synthetic Word Dataset

合成文本识别数据集，包含9百万张图像，涵盖了9万个英语单词。文件大小为10GB

360万的中文数据训练集

一个项目数据集：360万的中文数据训练集，最后可以finetune到97.7%的验证准确率

https://github.com/Sierkinhane/crnn_chinese_characters_rec/tree/master/data_generator

https://blog.csdn.net/javastart/article/details/104069709

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
ocr常用数据集介绍

Chinese Text in the Wild (CTW data)32,285 张图像和 1,018,402 个中文字符，来源于腾讯街景。图像大小2048*2048，数据集大小为31GB。ICPR WTMI2018中文数据集（天池比赛数据集）20000张图像。中英文混合。背景复杂。文件大小为2GB。ICDAR数据集ICDAR 2017 RCTW，主要是中文，共12263张图像。数据集绝大多数是相机拍的自然场景，一些是屏幕截图；包含了大多数场景，如室外街道、室内场景、手机截图等等Reading
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。