OCR 识别数据集、统计脚本总结供下载

最新推荐文章于 2024-02-01 12:42:59 发布

_小马奔腾

最新推荐文章于 2024-02-01 12:42:59 发布

阅读量2.8k

点赞数 6

分类专栏： Algorithm

本文链接：https://blog.csdn.net/dongfang1984/article/details/105675748

版权

这篇博客详细介绍了OCR领域的多个数据集，包括IIIT5k-Words、Street View Text (SVT)、ICDAR 2003至2015年系列、Total-Text以及Irregular Latin Datasets的Street View Text Perspective (SVTP) 和 Curve Text (CUTE80)。每个数据集的规模、特点和标注方式被逐一剖析，并提供了经过整理的下载资源，便于研究和算法开发。

摘要由CSDN通过智能技术生成

本文主要讨论如何做到深入了解OCR，怎么看论文是否是水论文。OCR的识别现在发展到什么样的状态。主流方法有哪些。回答这几个问题，我们首先需要了解OCR领域的数据集，每个数据集的规模多大，如何收集，包含哪些文字，如何标注的，识别难易程度。

本文的主要思路是

介绍OCR领域论文中常用的数据集，以及对应的特性，指标代表一个什么含义。如何测试。
通过了解数据集的方式，了解OCR领域的一些问题、发展方向。
每个数据集要么需要注册，要么格式不统一，解析麻烦，因此这里提供一份已经做好的格式，供下载；为读论文，写论文，开发算法的同学提供便利

一、OCR Regular Latin Datasets

1.1. IIIT5k-Words(IIIT5k)

Scene Text Recognition using Higher Order Language Priors
简介，5K张裁剪好的文字图片，如上图。2K张训练集，3K张测试集。测试集中包含了街景，网络图片等。仅标注62个字符，52个字母以及10个数字。
Every image is associated with a 50-word lexicon and a 1,000-word lexicon. Specifically, the lexicon consists of a ground-truth word and some randomly picked words.
我这边整理了一份可用的，GT

最低0.47元/天解锁文章

_小马奔腾

关注

6
点赞
踩
17

收藏

觉得还不错? 一键收藏
7
评论
OCR 识别数据集、统计脚本总结供下载

IIIT5KScene Text Recognition using Higher Order Language Priors简介，5K涨裁剪好的文字图片，如上图。2K张训练集，3K张测试集。测试集中包含了街景，网络图片等。仅标注62个字符，52个字母以及10个数字。我这边整理了一份可用的，供下载，GT为txt格式密码:u461。...
复制链接

扫一扫