摘要:表检测是许多文档分析应用程序中的关键步骤,因为表用于以结构化的方式向读者展示重要信息。由于表的不同布局和编码,这是一个困难的问题。研究人员提出了许多基于文档布局分析的表检测技术。大多数这些技术都无法推广,因为它们依赖于手工设计的功能,而这些功能对布局变化并不健壮。在本文中,我们提出了一种基于深度学习的表检测方法。在该方法中,首先对文档图像进行预处理。然后,这些图像被馈送到区域建议网络,然后是一个完全连接的神经网络,用于表检测。所提出的方法在不同布局的文档图像(包括文档、研究论文和杂志)上具有较高的精度。我们已经对公开可用的UNLV数据集进行了评估,它击败了Tesseract最先进的表检测系统。