Feature Enhancement Network: A Refined Scene Text Detector

最新推荐文章于 2023-03-01 20:09:59 发布

alibabazhouyu

最新推荐文章于 2023-03-01 20:09:59 发布

阅读量277

点赞数

分类专栏： CNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/alibabazhouyu/article/details/87094501

版权

问题1、怎么进行特征增强？。。。。高维度的语义信息利于目标分类，而低维度的语义信息利于对目标进行精确定位？用3x3的滑窗做region proposal以及在高维度用单一尺度做检测微调是不够的。FEN：任务特定，低维和高维语义特征融合，从而提高文本检测性能。adaptively weighted position-sensitive RoI pooling layer：进一步提高检...

摘要由CSDN通过智能技术生成

问题1、怎么进行特征增强？。。。。

高维度的语义信息利于目标分类，而低维度的语义信息利于对目标进行精确定位？

用3x3的滑窗做region proposal以及在高维度用单一尺度做检测微调是不够的。

FEN：任务特定，低维和高维语义特征融合，从而提高文本检测性能。

adaptively weighted position-sensitive RoI pooling layer：进一步提高检测精度。

positives mining strategy：处理细化阶段的样本不平衡的问题。

效果：在ICDAR 2011 and 2013的检测中，F-measure最高。

文本检测方法粗略分为三种：1、Character-based；2、Word-based本文的方法；3、Text-line-based。

一般的目标检测是2阶段two stages方法：proposals generation and detection refinement
使用ResNet-101 network as backbone network，并且把1、Feature Enhancement RPN (FE-RPN)和2、Hyper Feature Generation 集成到resnet101中。

本文主要是提出了一个特征增强网络来增强文本特征，从而更好的生成proposal和文本refinement。

1、传统只使用3×3滑窗进行区域建议，这里增加了两个卷积方式，加大了网络宽度，并且能增强特征；

2、之前只在高维特征使用单尺度进行文本检测框的精细化，这里使用了特征融合，更精确；

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Feature Enhancement Network: A Refined Scene Text Detector

问题1、怎么进行特征增强？。。。。高维度的语义信息利于目标分类，而低维度的语义信息利于对目标进行精确定位？用3x3的滑窗做region proposal以及在高维度用单一尺度做检测微调是不够的。FEN：任务特定，低维和高维语义特征融合，从而提高文本检测性能。adaptively weighted position-sensitive RoI pooling layer：进一步提高检...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。