MSR: Multi-Scale Shape Regression for Scene Text Detection

原文连接:MSR: Multi-Scale Shape Regression for Scene Text Detection

角度

针对现有的回归方形文本框的方式,作者提出了一种回归密集的边框点的形式,在可以生成匹配任意文本的同时,通过高级任务来增加网络提取特征的能力(个人认为)。考虑到多尺度的问题,作者提出了一种适合于多尺度的网络结构。

算法流程

在这里插入图片描述

图片被处理为图片金字塔后一起输入网络,得到三个不同的输出,第一个输出是central text region, 为文本区域的中心区域,然后结合这个中心区域,从第二个输出中取出中心区域的点到最近的边缘的横向距离x,从第三个输出取出中心区域的点到最近的边缘的纵向距离,综合点和坐标这两个距离,就能得到一组密集的边框点,将它们连起来,就是目标的边框。其中,central text region是只取了整个文本区域的中心部分,不但有找到点来推测边框的作用,还有分割好容易混叠的文本的作用。

网络结构

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值