【Paper Reading】【CTPN: Detecting Text in Natural Image with Connectionist Text Proposal Network】

最新推荐文章于 2024-10-16 01:06:03 发布

surfman777

最新推荐文章于 2024-10-16 01:06:03 发布

阅读量216

点赞数

分类专栏：场景文本检测文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Ocelot777/article/details/104662364

版权

CTPN通过垂直anchor机制直接在卷积特征图上检测文本行，结合RNN获取上下文信息提升检测准确性。该模型以端到端方式处理多尺度、多语言文本，避免了复杂的后处理步骤。

摘要由CSDN通过智能技术生成

abstract：

在卷积特征图中用一系列fine-scale text proposals来直接检测文本行
垂直anchor机制，同时预测每一个固定宽度proposal的位置和文本/非文本分数
使用RNN，以获取上下文信息来提高检测正确率
multi-scale and multi-language text reliable，无需额外后处理

introduction：

motivation：
- 深度CNN在目标检测上的发展，如Faster Region-CNN(R-CNN，提出RPN，从卷积特征图直接生成高质量的无类别目标proposals)
- 目标检测与文本行检测的区别：
  - 一般目标具有大致轮廓/中心点
  - 文本行没有相对固定的长度
contribution：
- 将文本检测问题转化为fine-scale text proposals序列的定位问题。提出垂直anchor机制，同时预测每一个固定宽度proposal的位置和文本/非文本分数。
- 提出in-network recurrence mechanism，连接卷积特征图中的sequential text proposals。
- 将上述两个方法无缝整合，得到端到端可训练模型，一次操作可以处理多尺度多语言文本，避免的更多的后处理

details：

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。