论文阅读-《Deep Matching Prior Network:Towards Tighter Multi-oriented Text Detection》

最新推荐文章于 2024-03-23 09:59:06 发布

yj_isee

最新推荐文章于 2024-03-23 09:59:06 发布

阅读量3.7k

点赞数 2

分类专栏： Computer Vision 计算机视觉论文研读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yaoqi_isee/article/details/73432759

版权

CVPR2017 by Yuliang Liu & Lianwen Jin

1.Motivation

对于自然文本的检测任务，原来的方法都专注于用矩形框来对文本进行定位。但是实际上因为文本图像存在透视变换等等问题，图像里面的自然文本并不是严格地呈现矩形的。这个时候用矩形框来定位的话会有以下问题：
DMP

左边表示用四边形定位的结果，右边表示用矩形定位的结果。
(a)表示用矩形定位会引入不必要的overlap
(b)表示用矩形会导致文本的边界不能很好的定位
(c)表示矩形会引入额外的噪声。

因此作者提出了自己的Deep Matching Prior Network用来检测四边形边框。

2.Proposed methodology

1.利用quadrilateral sliding windows来对text进行粗定位；
2.采用shared Monte-Carlo方法快速计算两个任意四边形的交叉面积
3.利用和gt overlap大的四边形进行text的精确定位
4.设计了smooth Ln loss来提高定位精度

2.1.Rough recall text with quadrilateral sliding window

作者指出之前的方法都是用水平的矩形来作为anchor box，这种方法对于倾斜的文本来说，相同的阈值下recall太低了。

最低0.47元/天解锁文章

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
13
评论
论文阅读-《Deep Matching Prior Network:Towards Tighter Multi-oriented Text Detection》

CVPR2017 by Yuliang Liu & Lianwen Jin1.Motivation对于自然文本的检测任务，原来的方法都专注于用矩形框来对文本进行定位。但是实际上因为文本图像存在透视变换等等问题，图像里面的自然文本并不是严格地呈现矩形的。这个时候用矩形框来定位的话会有以下问题：左边表示用四边形定位的结果，右边表示用矩形定位的结果。 (a)表示用矩形定位会引入不必要的overlap
复制链接

扫一扫

专栏目录

评论 13

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。