OCR 识别数据集、统计脚本总结供下载

这篇博客详细介绍了OCR领域的多个数据集,包括IIIT5k-Words、Street View Text (SVT)、ICDAR 2003至2015年系列、Total-Text以及Irregular Latin Datasets的Street View Text Perspective (SVTP) 和 Curve Text (CUTE80)。每个数据集的规模、特点和标注方式被逐一剖析,并提供了经过整理的下载资源,便于研究和算法开发。
摘要由CSDN通过智能技术生成

本文主要讨论如何做到深入了解OCR,怎么看论文是否是水论文。OCR的识别现在发展到什么样的状态。主流方法有哪些。回答这几个问题,我们首先需要了解OCR领域的数据集,每个数据集的规模多大,如何收集,包含哪些文字,如何标注的,识别难易程度。

本文的主要思路是

  • 介绍OCR领域论文中常用的数据集,以及对应的特性,指标代表一个什么含义。如何测试。
  • 通过了解数据集的方式,了解OCR领域的一些问题、发展方向。
  • 每个数据集要么需要注册,要么格式不统一,解析麻烦,因此这里提供一份已经做好的格式,供下载;为读论文,写论文,开发算法的同学提供便利

一 、OCR Regular Latin Datasets

1.1. IIIT5k-Words(IIIT5k)

  • Scene Text Recognition using Higher Order Language Priors

  • 简介,5K张裁剪好的文字图片,如上图。2K张训练集,3K张测试集。测试集中包含了街景,网络图片等。仅标注62个字符,52个字母以及10个数字。

  • Every image is associated with a 50-word lexicon and a 1,000-word lexicon. Specifically, the lexicon consists of a ground-truth word and some randomly picked words.

  • 我这边整理了一份可用的,GT

  • 6
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
Keras-OCR 是一个基于 Keras 框架构建的开源光学字符识别库,可以帮助我们进行图像中的文本检测和识别。Keras-OCR 自带了一些预训练模型和数据集,方便我们进行文本识别任务。 要下载 Keras-OCR 自带的模型和数据集,可以按照以下步骤进行操作: 1. 首先,确保已经安装了 Keras-OCR 的依赖库。可以通过 pip 命令安装,在命令行中输入以下命令: ``` pip install keras-ocr ``` 2. 安装完成后,就可以使用 Keras-OCR 的预训练模型和数据集了。Keras-OCR了一个名为 `keras_ocr.tools.downloader.download()` 的函数,用于下载预训练模型和数据集。在 Python 脚本中,引入 `keras_ocr.tools` 模块,并使用 `download()` 函数进行下载。示例如下: ``` from keras_ocr.tools import downloader downloader.download() ``` 3. 运行上述代码后,将会弹出一个命令行交互界面,展示可下载的模型和数据集列表。可以根据需求选择需要下载的模型和数据集。输入数字来选择要下载的内容,然后按下回车键进行确认。 4. 下载过程会自动开始,并显示下载进度。下载完成后,Keras-OCR 自带的模型和数据集将存储在默认的文件夹中,可以在 Python 脚本中直接引用这些文件进行文本识别任务。 总结一下,通过安装 Keras-OCR 并使用 `keras_ocr.tools.downloader.download()` 函数,我们可以方便地下载并使用 Keras-OCR 自带的预训练模型和数据集,以进行光学字符识别
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值