OCR(光学字符识别)常用的数据集通常用于训练和评估OCR模型。这些数据集包含了各种类型的文本图像,并提供了相应的标注。以下是一些广泛使用的OCR数据集:
1. MNIST
- 描述:包含手写数字(0-9)的图像数据集,是OCR任务中的经典数据集。
- 图像数量:60,000张训练图像和10,000张测试图像。
- 应用:手写数字识别。
- 链接:MNIST 数据集
2. IAM Handwriting Database
- 描述:包含手写英文单词和句子的图像数据集,提供了详细的标注。
- 图像数量:包括数万字的手写单词和句子。
- 应用:手写英文文本识别。
- 链接:IAM Handwriting Database
3. COCO-Text
- 描述:从Microsoft COCO数据集中提取的文本数据集,包含各种场景下的文本。
- 图像数量:超过63,000张图像,包含超过173,000个文本实例。
- 应用:复杂场景下的文本检测和识别。
- 链接:COCO-Text 数据集
4. SynthText
- 描述:合成的文本数据集,包含在自然场景图像中插入的文本。
- 图像数量:超过800,000张图像。
- 应用:场景文本检测和识别。
- 链接:SynthText 数据集
5. Tesseract OCR Data Sets
- 描述:用于Tesseract OCR引擎的多语言数据集,包括多种语言的文本数据。
- 应用:支持多语言的OCR任务。
- 链接:Tesseract OCR Data Sets
6. TextVQA
- 描述:包含视觉问答(VQA)场景中的文本数据集,结合了文本识别和视觉理解。
- 图像数量:超过28,000张图像,包含多种问题和答案。
- 应用:文本识别和视觉问答。
- 链接:TextVQA 数据集
7. RIMES
- 描述:手写法语文档数据集,包含手写信件和表单。
- 图像数量:数千个手写文本样本。
- 应用:法语手写文本识别。
- 链接:RIMES 数据集
8. SCUT-CTW1500
- 描述:用于复杂场景文本检测的数据集,包含文本密集的图像。
- 图像数量:1,500张图像,包含各种复杂文本布局。
- 应用:复杂场景下的文本检测。
- 链接:SCUT-CTW1500 数据集
9. Kuzushiji-MNIST
- 描述:包含日文“草书体”字符的手写数据集,是MNIST数据集的扩展。
- 图像数量:70,000张训练图像和10,000张测试图像。
- 应用:日文字符识别。
- 链接:Kuzushiji-MNIST 数据集
这些数据集在不同的OCR应用中提供了丰富的训练和测试数据,可以用于提高OCR模型的性能和泛化能力。