表格分割方法

表格区域划分

1. 有线

1.1 霍夫直线检测法

Duda R O , Hart P E . Use of Hough Transformation to Detect Lines and Curves in Pictures[J]. Communications of the ACM, 1972, 15(1):11-15.

提出了基于霍夫变换检测图像中线的方法,该方法解决了基于霍夫变换的直线检测没有边界的问题。

首先将直线方程转换到霍夫坐标系(参数平面)

xsinθ+ycosθ=ρ(x,y坐标系下) 

ρ=xsinθ+ycosθ θ∈[0,π](霍夫ρ,θ坐标系下)

带入试试就能知道:

  1. 直角坐标系下的点对应霍夫坐标系下的一条曲线
  2. 霍夫坐标系下的点对应直角坐标系下的一条直线
  3. 直角坐标系下共线的点对应霍夫坐标系下多曲线交点
  4. 霍夫坐标系下共曲线多点对应直角坐标系下交于同一点的多条直线
  5. 霍夫坐标系下的直线对应直角坐标系下与一个圆相切的直线系

首先将直角坐标系下n个点映射到参数平面的曲线上,共有n(n-1)/2个交点,可以通过交点找到直线,但复杂度为O(n^2)。
为了减少复杂度,可以限定:

0≤θ≤π    

-R≤ρ≤R

将角度划分为d1个小区间,并依次计算对应的ρ,计算量为nd1,若直角坐标系中的两点在霍夫空间上同一个θ上的投影ρ接近,则说明两点在直角坐标系中很可能共线(在线的法向量上投影相近),此方法复杂度为O(nd1),当n较大时可以有效减少计算量。

1.2 形态学

通过对表格的二值化、矩形kernel的腐蚀膨胀等操作,将表格中的字符去除掉,保留框线。

1.3 矢量化算法

将像素转为矢量进行处理

1.2.1 有向单连通链

郑冶枫,刘长松,丁晓青,潘世言.基于有向单连通链的表格框线检测算法[J].软件学报,2002(04):790-796.

用于检测倾角大于45°的斜线,分横向纵向两类单联通链。横向单连通链由横向的多个宽为1像素,长度不定的游程组成,且相邻游程横向相连通。纵向同理。

为了提升方法的准确性,定义同线距离,若两个同向单连通链的距离校友同线距离,则将其连通。

字符会对连通链产生影响,需要先行使用直方图确定字符的最大尺度,以此为阈值过滤掉字符。

由以上方法得到的表格框线仍存在多检、漏检现象,需要进行筛选、补全。

1.2.2 游程聚类

白伟, 崔喆. 基于游程聚类的表格框线检测算法[J].计算机应用, 2018(A01):179-182.

1.3 线特征检测LSD&LBD

Von Gioi R G, Jakubowicz J, Morel J M, et al. LSD: a line segment detector[J]. Image Processing On Line, 2012, 2: 35-55.

https://www.cnblogs.com/Jessica-jie/p/7512152.html

2. 无线

2.1 投影法

丁明宇,牛玉磊,卢志武,文继荣.基于深度学习的图片中商品参数识别方法[J].软件学报,2018,29(04):1039-1048.

对表格进行横纵方向投影,通过投影的峰值(谷)找到分割线

2.2 根据字符识别划分

MSER
OCR

3. 深度学习法

C. Tensmeyer, V. I. Morariu, B. Price, S. Cohen and T. Martinez, “Deep Splitting and Merging for Table Structure Decomposition,” 2019 International Conference on Document Analysis and Recognition (ICDAR), Sydney, Australia, 2019, pp. 114-121, doi: 10.1109/ICDAR.2019.00027.

先分割,再合并
使用SFCN + RPN + CPN进行分割
Shared Fully Convolutional Network(SFCN)
提取特征
Row Projection Network (RPN)
行分割
Column Projection Network (CPN)
列分割

将分割结果与原图像输入合并网络,输出每个分割单元格是否应被合并(0,1)


S. A. Siddiqui, P. I. Khan, A. Dengel and S. Ahmed, “Rethinking Semantic Segmentation for Table Structure Recognition in Documents,” 2019 International Conference on Document Analysis and Recognition (ICDAR), Sydney, Australia, 2019, pp. 1397-1402, doi: 10.1109/ICDAR.2019.00225.

将表格结构分析任务看做语义分割,使用基于FCN的网络对表格的行列进行划分
使用ImageNet做与训练,Inception ResnetV2作为主干网进行特征提取
3*3转置卷积做上采样,并使用了BN和leaky RelU
为了简化任务,引入一致性假设:行开始于第一列,结束于最后一列,列同理
其实就是将表格视为规整的行列结构,然后 将同行、列的像素合并作为划分依据

S. R. Qasim, H. Mahmood and F. Shafait, “Rethinking Table Recognition using Graph Neural Networks,” 2019 International Conference on Document Analysis and Recognition (ICDAR), Sydney, Australia, 2019, pp. 142-147, doi: 10.1109/ICDAR.2019.00031.

通过OCR提取位置特征,CNN提取图像特征,将两者作为输入放入图神经网络,由此判断OCR提取出的字符块是否同格/行/列

4. 数据集

3.1 TableBank

https://github.com/doc-analysis/TableBank
https://arxiv.org/pdf/1903.01949.pdf

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值