文本检测算法之CTPN 学习笔记

最新推荐文章于 2024-05-11 12:00:00 发布

SpritewithIce

最新推荐文章于 2024-05-11 12:00:00 发布

阅读量1.2k

点赞数

文章标签：算法深度学习 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_32897939/article/details/119640338

版权

本文介绍了CTPN在场景文字检测中的应用，该算法利用VGG16提取特征，结合双向LSTM处理序列特征，并通过特定的锚点设计和损失函数优化文字检测效果。CTPN在Faster R-CNN基础上，针对文本检测的特性进行改进，适用于长矩形文本的检测。

摘要由CSDN通过智能技术生成

现有的文本检测方法主要有两大类，一种是基于回归框的检测方法(基于物体检测的方法)，如CTPN，EAST，这类方法很难检测任意形状的文本(曲线文本)，一种是基于像素的分割检测器(基于实例分割的方法)，这类方法很难将彼此非常接近的文本实例分开，包括PSENet。
在这里插入图片描述

1.概述

在2015年Faster R-CNN在物体检测上提供了非常好的算法框架。所以用深度学习的思想解决场景文字检测自然而然的成为研究热点。
Faster R-CNN做目标检测步骤：
在这里插入图片描述

基础网络做特征提取；
特征送入RPN做候选框提取；
分类层对候选框内物体进行分类，回归层对候选框的(x,y,w,h)进行精细调整。

详细介绍看这里：https://zhuanlan.zhihu.com/p/31426458

对比发现，场景文字检测和物体检测存在显著的不同之处：

文本大多数以长矩形形式存在，即长宽比一般较大或较小，这与普通的目标检测中的物体不一样
场景文字检测有明显的边界，例如Wolf 准则 [2]，而物体检测的边界要求较松，一般IoU为0.7便可以判断为检测正确；
场景文字检测有明显的序列特征&#

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。