【深度学习】【CVPR 2016】Weakly Supervised Deep Detection Networks

本文介绍了深度学习中的SPP模块及其在弱监督深度检测网络(WSDDN)中的应用。SPP解决了R-CNN中尺寸变化的问题,保证了全连接层前特征的一致性。WSDDN结合SPP和region proposals,通过Selective Search Windows (SSW)和Edge Boxes (EB)获取提案,并通过加一维的方式拼接多个提案。网络包含分类和检测两个分支,采用特定的损失函数进行训练。在测试阶段,根据阈值和NMS操作确定最终结果。实验部分讨论了评估指标如AP和CorLoc。
摘要由CSDN通过智能技术生成

【CVPR 2016】WSDDN

结构

先学习一下SPP(spatial pyramid pooling),如下图所示,在R-CNN中,进入卷积层之前必须对图片进行crop或者warp以保证大小相同(因为有全连接层),但是这样不仅会影响识别精度,而且检测的速度也很慢,因为原始图片经过crop或者warp后得到的图片会重复使用卷积网络计算feature maps,但是SPP只计算一次原始图像的feature maps,SPP主要的作用就是保证在进入全连接层前维度一致。
在这里插入图片描述
SPP论文(Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition(TPAMI2015))中还展现了经过卷积层后输出的特征图主要有两个信息:

  1. 对个别特征的响应强度
  2. 对应的空间位置

比如下图,filter#175对于四边形比较敏感,而filter#55对于圆形比较敏感。
在这里插入图片描述
SPP的模块如下图所示,这里的输入图像是经过SS后proposal regions
在这里插入图片描述SPP将feature maps分成 4 × 4 4\times4 4×4 2 × 2 2\times2 2×2 1 × 1 1\times1

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值