MSR: Multi-Scale Shape Regression for Scene Text Detection

最新推荐文章于 2021-10-16 13:13:06 发布

拉普拉斯咚

最新推荐文章于 2021-10-16 13:13:06 发布

阅读量770

点赞数

分类专栏：文本检测文章标签：场景文本检测任意形状文本多尺度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_38018513/article/details/102647916

版权

原文连接：MSR: Multi-Scale Shape Regression for Scene Text Detection

角度

针对现有的回归方形文本框的方式，作者提出了一种回归密集的边框点的形式，在可以生成匹配任意文本的同时，通过高级任务来增加网络提取特征的能力（个人认为）。考虑到多尺度的问题，作者提出了一种适合于多尺度的网络结构。

算法流程

在这里插入图片描述

图片被处理为图片金字塔后一起输入网络，得到三个不同的输出，第一个输出是central text region，为文本区域的中心区域，然后结合这个中心区域，从第二个输出中取出中心区域的点到最近的边缘的横向距离x，从第三个输出取出中心区域的点到最近的边缘的纵向距离，综合点和坐标这两个距离，就能得到一组密集的边框点，将它们连起来，就是目标的边框。其中，central text region是只取了整个文本区域的中心部分，不但有找到点来推测边框的作用，还有分割好容易混叠的文本的作用。

网络结构

最低0.47元/天解锁文章

拉普拉斯咚

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MSR: Multi-Scale Shape Regression for Scene Text Detection

原文连接：MSR: Multi-Scale Shape Regression for Scene Text Detection角度针对现有的回归方形文本框的方式，作者提出了一种回归密集的边框点的形式，在可以生成匹配任意文本的同时，通过高级任务来增加网络提取特征的能力（个人认为）。考虑到多尺度的问题，作者提出了一种适合于多尺度的网络结构。算法流程图片被处理为图片金字塔后一起输入网络，得到三...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。