ContourNet阅读笔记

ContourNet是一种针对场景文本检测的解决方案,它通过Adaptive-RPN解决尺度无关问题,利用Local Orthogonal Texture-aware Module减少误检。Adaptive-RPN通过IoU优化获取文本提案,而LOTM在水平和垂直方向建模纹理信息,通过Point Re-scoring Algorithm过滤误检。此方法在处理颜色、纹理和尺度变化时表现优秀。
摘要由CSDN通过智能技术生成

关注于false positives和large scale variance。提出了contourNet,有效解决以上两个问题。
(1)尺度无关的Adaptive-RPN,通过关注predicted和ground-truth之间的IoU生成proposals。
(2)Local Orthogonal Texture-aware Module从两个方向建模,使用contour points集合表示文本区域
考虑到强单向性或弱正交性会引起误false positives
介绍:颜色、纹理、尺度变化是场景文本特有的属性。
false positives(FPs)在最近的研究中没有得到足够的关注,在[38]中被认为是任意形状文本检测任务的一个关键瓶颈。近期,基于CNN的方法通过k *k的卷积核对任意方向的纹理信息进行建模。然而,这个操作对于一些包含相似纹理特征的情况很敏感,并趋向于高的响应率。SPCNET把这个问题归咎于缺少上下文信息和准确的分类scores,因此一个文本上下文模块用于补偿全局语义信息并通过分割图改善边框。Liu[21]用四个顶点的置信度对检测结果重新打分,监督边框的紧密性。不同于这些方法,我们只使用局部纹理信息解决FPs问题,更直接,计算量更少。动机有两个方面(1)强单向纹理特征的FPs不会被其正交方向激活(2)同时考虑两个方向的响应,可以有效抑制FPs。因此有理由在两个正交方向建模纹理信息。受传统边缘检测算子的启发,在我们的方法中使用水平和垂直方向。
第二个挑战是场景文本的大尺度变化,使其很难使用基于CNN的方法学习样本。MSR使用一个多尺度的网络获得各种尺度的文本表示。DSRN通过多尺度文本的不一致激活解决这个问题,提出了一种双向操作讲卷积特征映射到一个尺度不变的空间。我们关注形状信息,使

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值