Ocr 数据集

ICDAR是两年一度的文档分析与识别国际会议,提供多种自然场景文字检测和识别的标注数据集,如CVPR 2020年的DocVQA,2019年的Robust Reading Challenge等。这些数据集涵盖多元语言和场景,如MLT、LSVT、ArT、SROIE和ReCTS,用于推动OCR技术的发展。
摘要由CSDN通过智能技术生成
  • ICDAR(International Conference on Document Analysis and Recognition)专注文字和字符识别的会议,每两年举办一次(更新一次数据)。包含自然场景下的中英文检测和识别的标注信息,下载数据时需要注册。每次都会发布新主题的数据集,如:
It is about character and symbol recognition, printed/handwritten text recognition, graphics analysis and recognition, document analysis, document understanding, historical documents and digital libraries, document based forensics, camera and video based scene text analysis
  1. CVPR 2020年Document Visual Question Answering" (DocVQA) challenge
  2. 2019 Robust Reading Challenge on Scene Text Visual Question Answering, focuses on a specific type of Visual Question Answering task, where understanding the textual information in a scene is necessary in order to give an answer 
  3. 2019 Multi-lingual scene text detection and recognition(MLT)
  4. 2019 Large-scale Street View Text with Partial
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值