R-CNN or SPP-net

词袋(Bag-of-Words, BoW)模型

空间金字塔池化层:将特征图以空间块的形式进行分块,这些空间块的尺寸和图像的尺寸是成比例的,这样块的数量就是固定的了,如下图就有16+4+1个空间块,每个块提取出一个特征,这样刚好就是我们要提取的21维特征向量。经过这一层,输出向量大小为Mk,M=#bins(块数), k=#filters(卷积核个数),作为全连接层的输入。这样,全连接层的输入尺寸就固定了。而深度网络的滑窗池化(sliding window pooling)则对依赖于输入图像的尺寸。
在这里插入图片描述
R-CNN or SPP-net

  1. R-CNN,整个过程是:
  • 通过selective search,对待检测的图片进行搜索出~2000个候选窗口。
  • 把这2k个候选窗口的图片都缩放到227*227,然后分别输入CNN中,每个proposal提取出一个特征向量,(即:利用CNN对每个proposal进行提取特征向量。)
  • 把上面每个候选窗口的对应特征向量,利用SVM算法进行分类识别。
    可以看出R-CNN的计算量是非常大的,因为2000个候选窗口都要输入到CNN中,分别进行特征提取。
  1. 而对于SPP-Net,整个过程是:
  • 首先通过selective search,将待检测的图片进行搜索出2000个候选窗口。(这一步和R-CNN一样)
  • 特征提取阶段。这一步骤的具体操作如下:把整张待检测的图片,输入CNN中,进行一次性特征提取,得到特征图,然后在特征图中找到各个候选框的区域,再对各个候选框采用空间金字塔池化,提取出固定长度的特征向量。而R-CNN输入的是每个候选框,然后在进入CNN,因为SPP-Net只需要一次对整张图片进行特征提取,速度会大大提升。
  • 最后一步,采用SVM算法进行特征向量分类识别。
    只进行了一次CNN操作。

难负例挖掘(Hard Negative Mining)

hard negative:容易被看作正样本的负样本,即那些容易分类错误的样本。重叠率IoU超过一定阈值的,则认为它是positive sample,否则为negative sample,IoU较高的negative sample就是 hard negative。
Hard Negative Mining就是多找一些hard negative加入负样本集,进行训练,这样会比easy negative组成的负样本集效果更好。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值