表格恢复 结构识别 现状

  • GFTE: Graph-based Financial Table Extraction:表格识别任务的数据集构建      有实现
    • 发布了一个标准的中文数据集 FinTab
    • 基于图卷积神经网络(Graph Convolutional Network ,GCN)的模型 GFTE 作为该表格识别数据集中的基线方法
      • (a) 构建基本事实,包括表格区域的图像、文本内容、文本位置和结构标签
      • (b) 基于单元格构造一个无向图 G=<V, R_C>。
      • (c)使用 GFTE 来预测相邻关系,包括垂直关系和水平关系
  • TableNet: Deep Learning model for end-to-end Table detection and Tabular data extraction from Scanned Document Images:表格检测与结构识别任务   无官方实现
    • 利用了表格检测和表格结构识别这两个任务之间固有的相互依赖性,利用一个基础网络通过预先训练的 VGG-19 特性进行初始化
    • 两个解码器分支,用于 1)表格区域的分段和 2)表格区域内列的分段
    • 使用基于规则的行提取来提取表格单元格中的数据
  • Table Structure Extraction with Bi-directional Gated Recurrent Unit Networks:表格结构识别任务
  • 该方法的核心就是 GRU 的引入,与传统的基于 CNN、启发式算法的方法相比,基于序列的模型可以有效捕捉表格中重复的行 / 列结构,因此能够大大改进表格结构识别的性能。 
    • 首先对表格图像进行预处理,然后将其输入带有门控递归单元(Gated Recurrent Unit,GRU)的双向递归神经网络
    • 通过 softmax 激活实现全连接层
    • 网络从上到下、从左到右扫描图像,并将每个输入分类为行分隔符或列分隔符
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值