Accurate Single Stage Detector Using Recurrent Ring Convolution

好的目标检测系统满足两个条件:

1:检测不同规模目标

2:检测不同尺寸比例的目标



Faster——RCNN依赖于最后卷积层的重叠的3X3的大的感受野去同时检测大目标和小目标。

因为多个池化层大的使用,导致最后卷积层后的特征图的分辨率比输入图小得多。

这使得检测小目标很困难,因为低分辨率的特征图中,代表小目标的细节特征很弱。


本文改进SSD文章算法,SSD用数学定义如下:



fn(.)是非线性block(即卷积,RELU和池化层等)

Tn(.)表示将第n层特征图转化成某个规模范围的检测结果

D是将所有中间层结果Tn(.)汇总成最终的检测结果


从上面公式可以看出:

每个层的特征图仅仅负责它对应规模的输出结果,所以要求必须设置精巧才能支持感兴趣目标的检测和精确定位,即满足:

(1)图征图需要有足够分辨率来呈现目标细节

(2)将输入图片转化成特征图的函数(网络)要足够深,才能将目标的高层抽象融入特征图

(3)特征图要包含适当的上下文信息contextual,交叠的遮蔽的小的模糊的饱和的目标能据此上下文信息推断出来


然而公式(1) (2) 当k很大时,n比 n..k深得多,n..k不满足条件(2)


Faster——RCNN没有深度问题因为他的region proposalS 是从最后一层的特征图生成的,即:



然而公式(3)不满足条件(1),因为多个池化层大的使用,导致Faster——RCNN最后一层的特征图的分辨率比输入图小得多,这使得检测小目标很困难,因为低分辨率的特征图中,代表小目标的细节特征很弱。



于是,作者提出了RRC检测:




H 集包括了所有利于检测的特征图,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值