CV_OCR常用数据集

OCR(光学字符识别)常用的数据集通常用于训练和评估OCR模型。这些数据集包含了各种类型的文本图像,并提供了相应的标注。以下是一些广泛使用的OCR数据集:

1. MNIST

  • 描述:包含手写数字(0-9)的图像数据集,是OCR任务中的经典数据集。
  • 图像数量:60,000张训练图像和10,000张测试图像。
  • 应用:手写数字识别。
  • 链接MNIST 数据集

2. IAM Handwriting Database

  • 描述:包含手写英文单词和句子的图像数据集,提供了详细的标注。
  • 图像数量:包括数万字的手写单词和句子。
  • 应用:手写英文文本识别。
  • 链接IAM Handwriting Database

3. COCO-Text

  • 描述:从Microsoft COCO数据集中提取的文本数据集,包含各种场景下的文本。
  • 图像数量:超过63,000张图像,包含超过173,000个文本实例。
  • 应用:复杂场景下的文本检测和识别。
  • 链接COCO-Text 数据集

4. SynthText

  • 描述:合成的文本数据集,包含在自然场景图像中插入的文本。
  • 图像数量:超过800,000张图像。
  • 应用:场景文本检测和识别。
  • 链接SynthText 数据集

5. Tesseract OCR Data Sets

  • 描述:用于Tesseract OCR引擎的多语言数据集,包括多种语言的文本数据。
  • 应用:支持多语言的OCR任务。
  • 链接Tesseract OCR Data Sets

6. TextVQA

  • 描述:包含视觉问答(VQA)场景中的文本数据集,结合了文本识别和视觉理解。
  • 图像数量:超过28,000张图像,包含多种问题和答案。
  • 应用:文本识别和视觉问答。
  • 链接TextVQA 数据集

7. RIMES

  • 描述:手写法语文档数据集,包含手写信件和表单。
  • 图像数量:数千个手写文本样本。
  • 应用:法语手写文本识别。
  • 链接RIMES 数据集

8. SCUT-CTW1500

  • 描述:用于复杂场景文本检测的数据集,包含文本密集的图像。
  • 图像数量:1,500张图像,包含各种复杂文本布局。
  • 应用:复杂场景下的文本检测。
  • 链接SCUT-CTW1500 数据集

9. Kuzushiji-MNIST

  • 描述:包含日文“草书体”字符的手写数据集,是MNIST数据集的扩展。
  • 图像数量:70,000张训练图像和10,000张测试图像。
  • 应用:日文字符识别。
  • 链接Kuzushiji-MNIST 数据集

这些数据集在不同的OCR应用中提供了丰富的训练和测试数据,可以用于提高OCR模型的性能和泛化能力。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值