文字识别/文本检测数据集

本文列举了多个中文文本识别数据集,包括CTW、RCTW-17、ICPR MWI 2018、Total-Text、Google FSNS、COCO-TEXT、Synthetic Data for Text Localisation、SynthText以及Caffe-ocr中文合成数据。这些数据集涵盖了各种场景、字体、大小和复杂背景,用于训练和评估文字识别算法。
摘要由CSDN通过智能技术生成

1、Chinese Text in Wild (CTW)

32285张图像,1018402个中文字符(来自于腾讯街景);

 包含平面文本,凸起文本,城市文本,农村文本,低亮度文本,远处文本,部分遮挡文本。

图像大小2048*2048,数据集大小为31GB。

(8:1:1)比例训练集(25887张图像,812872个汉字),测试集(3269张图像,103519个汉字),验证集(3129张图像,103519个汉字)。

文献链接:https://arxiv.org/pdf/1803.00085.pdf 
数据集下载地址:https://ctwdataset.github.io/

 

2、Reading Chinese Text in the Wild(RCTW-17)

12263张图像,训练集8034张,测试集4229张,共11.4GB。

大部分图像由手机相机拍摄,含有少量的屏幕截图,图像中包含中文文本与少量英文文本。图像分辨率大小不等。

下载地址:http://mclab.eic.hust.edu.cn/icdar2017chinese/dataset.html
文献:http://arxiv.org/pdf/1708.09585v2

 

3、ICPR MWI 2018 挑战赛<

  • 5
    点赞
  • 70
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值