本文介绍ICCV2021的论文"Parsing Table Structures in the Wild"的主要工作。本文主要针对自然真实场景有线表格结构识别这一具有挑战性的问题进行研究。为了设计这样一个系统,本文在CenterNet的基础上提出 Cycle-CenterNet,该方法增加新的cycle-pairing模块同时检测表格单元格并将其分组到结构化表格中。在cycle-pairing模块中,提出一个新的损失函数pairing loss用于网络训练。同时本文还提出一个大的数据集名为WTW, 它包含了照片、扫描文件、网页等多个场景,并进行了准确的标注。实验结果表明本文提出的Cycle-CenterNet使用TEDS为评价指标在WTW数据集上提升了24.6%。
一 研究背景
表格在我们的日常生活中常用来记录和总结重要数据,以便快速更好地可视化信息。 随着智能手机和便携式相机的日益普及,使用表格照片共享信息非常普遍。 因此,从自然场景照片或图像中自动提取和解析表格结构是非常必要的。
当前的数据集大都背景比较干净,同时表格结构比较明确,并且行列通常是对齐的。有线表数据和无线表数据有很大的不同。自然场景中的无线表识别是非常具有挑战性的,它们由于缺乏感知分组的参考很难被标注人员标注。因此本文提出的WTW数据集为有线表数据集。
针对本文提出有线表数据集WTW,本文提出Cycle-CenterNet, 它同时检测单元格的角点和中心点,并且通过学习共同角点将单元格进行分组。