细粒度 文档图像版面分析

基于实例分割网络的细粒度文档图像版面分析

英文引用:Zhao P, Wang W, Cai Z, et al. Accurate Fine-Grained Layout Analysis for the Historical Tibetan Document Based on the Instance Segmentation[J]. IEEE Access, 2021, 9: 154435-154447.
中文引用:赵鹏海. 乌金体藏文文档版面分析与识别系统[D].西北民族大学,2022.DOI:10.27408/d.cnki.gxmzc.2022.000367.

摘要

版面分析是文档信息理解的重要步骤,是对文档图像内的文字、图片等区域进行自动分析和理解的过程。通过版面分析,可以完成对图片中待识别区域的定位与分割,丛而为后续的识别打下基础。大多数版面分析方法其分割粒度较大,所得到的区域仍需进一步切分才可为识别所用,而现有的细粒度的版面分析方法在文本行复杂交错的藏文古籍文档图像表现较差。为了得到准确的版面分析结果,我们提出了一种细粒度的版面分析方法。首先,使用传统的行切分算法并辅以人工矫正,快速生成了所需的标注文件。其次,使用标注数据训练SOLOv2,使得网络完成拟合。最后,使用该网络进行推理,得到输入图像中的文本行与左右标题区域。实验结果表明,我们使用的方法可以较为准确地完成对藏文古籍文档图像的版面分析,AP50值最高可达93.6%。总的来说,本文证明了SOLO系列网络在藏文古籍文档图像版面分析任务中的有效性,我们也认为该网络对其它类型的文档的版面分析也会是准确高效的。

引言

版面分析(DLA)是DAR中的一个重要组成部分,其目的是定位待识别文字区域,为后续的识别的前提。待识别区域可以是文本块图像,文本行图像,也可以是一幅插图,即图像理解的主要研究对象。大多数现有的版面分析相关研究方法是基于语义分割网络的,这些网络不能区分实例个体且往往分割粒度较大,所获得的文本块区域仍然需要进一步切

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值