GFTE:Graph-based Financial Table Extraction
摘要表格数据是信息表达的一种重要形式,它可以按标准结构组织数据,以便于信息的检索和比较。 但是,在金融业和许多其他领域中,表格通常以非结构化的电子文件如便携式文档格式(PDF)和图像等形式公开,难以直接提取。 在本文中,为了促进从非结构化数字文件中进行基于深度学习的表格提取,我们发布了一个名为FinTab的标准中文数据集,其中包含1,600多种不同类型的财务表及其在JSON中的相应结构表示形式。 此外,我们提出了一种新的基于图的卷积神经网络模型,称为GFTE,作为将来进行比较的基准。 GFTE将图像特征,
原创
2020-05-28 21:32:52 ·
3439 阅读 ·
23 评论