扫描式SSD用于公式检测,代码已开源


SSD是大家常见的目标检测器,在类似COCO的日常生活类物体检测,或者人脸、行人检测上都有应用,不过是否可以用于文本领域的检测呢?

今天跟大家介绍一篇新出的论文 ScanSSD: Scanning Single Shot Detector for Mathematical Formulas in PDF Document Images,美国罗彻斯特理工学院提出一种扫描式SSD(ScanSSD),仅使用视觉特征,而不使用任何文本的版面信息,进行数学公式检测。

ScanSSD训练时文档图像大小为512 * 512,在给定600 dpi的文档页图像上,SSD检测器以多尺度滑动窗口的方式定位公式,然后把检测结果合并,得到最终的整个页面的公式。

常见的学术文献中数学公式示例:

可见,既有独占一行的公式(红色区域),也有嵌入进文本的公式(蓝色区域)

在实验中,作者使用了 TFD-I

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值