古籍文档图像二值化数据集 document image binarization dataset

文档图像二值化数据集汇总Document Image Binarization dataset

文档图像二值化是文档图像分析与识别流程中的一个重要步骤。必须有一个基准数据集和一个客观的评估方法来捕获当前文档图像二值化方法的效率。总体目标是使用已建立的评估性能度量记录机器打印和手写文档图像二值化的最新进展。

【文档图像二值化 paper 系列】

文档二值化数据集:

  • DIBCO : Document Image Binarization Contest, 继DIBCO和H-DIBCO系列(DIBCO 2009、H-DIBCO 2010、DIBCO 2011、DIBCO 2013、DIBCO 2017、H-DIBCO 2014、H-DIBCO 2016、H-DIBCO 2018)分别与ICDAR’09、ICDAR’11、ICDAR’13、ICDAR’17、ICFHR 2010、ICFHR 2012、ICFHR 2014、ICFHR 2016、ICFHR 2018联合举办成功之后,该竞赛每两年举办一次。
  • Persian: 这个数据集包含15个历史旧手稿图像,这些图像是从伊朗亚兹德的米尔扎·穆罕默德·卡泽梅尼(隶属于哈扎特·埃马姆扎德·贾法尔)的文献和旧手稿库的历史记录中收集的。图像遭受各种类型的退化,包括漏墨、褪色和模糊。该数据集是一系列提供文档图像及其基本事实的第一个数据集,作为对文档图像分析和识别(DAIR)社区的贡献。计划在未来增加数据集,并创建一个涵盖版面理解任务的数据集。
  • PLM : 巴厘岛棕榈叶手稿图像中手写文本分析竞赛。
  • S-MS :文字材料的光谱分析对于古代文献的研究和分析具有重要意义。多光谱(MS)成像是一种创新的非破坏性材料分析技术。为此,收集一个多光谱古手写字母图像数据库。
  • LRDE-DBD :这是一个由完整的文档图像、GT和工具组成的数据集,用于对二值化算法进行评估,允许基于像素的精度和基于OCR的评估。
  • Label :shipping label image 数据集由不同类型和各国的1082个图像组成,使用智能手机获取。
  • 德宏傣文古籍图像二值化数据集Tai Le historical document image binarization dataset, TLHDIBD2021.
    https://pan.baidu.com/s/1Pnq1XrBM16uhavSETK8wpQ 提取码:TLDI
  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 7
    评论
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yddcs

你的鼓励--创作的动力!!!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值