OverFeat:Integrated Recognition, Localization and Detection using Convolutional Networks

文章目录

Sermanet P., Eigen D., Zhang X., Mathieu M., Fergus R., LeCun Y. OverFeat:integrated recognition, localization and detection using convolutional networks. In International Conference on Learning Representations (ICLR), 2014.

通常的sliding windows需要大量的计算量: 首先我们需要框出一个区域, 再将该区域进行判断, 当区域(windows)的数量很多的时候, 这么做是非常耗时的.

但是本文作者发现, 通过卷积, 可以将所有的区域一次性计算, 使得大量重复计算能够节省下来. 个人觉得还是非常有意思的.

主要内容

如上图所示, 第一行展示了对一个普通图片进行判断的过程:

  1. input: 14 × 14 × ∗ 14 \times 14 \times * 14×14×, 经过 5 × 5 5 \times 5 5×5的卷积核(stride=1, padding=0), 得到:
  2. 10 × 10 × ∗ 10 \times 10 \times * 10×10×的mappings, 再经过 2 × 2 2 \times 2 2×2的pooling (stride=2, padding=0), 得到:
  3. 5 × 5 × ∗ 5 \times 5 \times * 5×5×的mappings, 到此为特征提取阶段;
  4. 接下来, 是分类器部分, 实际上, 原本是全连接层部分, 我们首先以全连接层的角度过一遍, 令 d 1 = 5 × 5 × ∗ d_1=5 \times 5 \times * d1=5×5×:
  5. 通过 W ∈ R d 2 × d 1 W \in \mathbb{R}^{d_2 \times d_1} WRd2×d1 将特征映射为 d 2 d_2 d2的向量;
  6. 再通过 W ′ ∈ R C × d 2 W' \in \mathbb{R}^{C \times d_2} WRC×d2 将特征映射为 C C C的向量(C表示类别数目);
  7. 既然全连接层是特殊的卷积, 4相当于
  8. d 1 d_1 d1 5 × 5 5 \times 5 5×5的卷积作用于特征, 5相当于
  9. d 2 d_2 d2 1 × 1 1 \times 1 1×1的卷积, 6相当于
  10. C C C 1 × 1 1 \times 1 1×1的卷积.

再来看第二行, 其输入为 16 × 16 16 \times 16 16×16大小的图片, 输出是 2 × 2 × C 2 \times 2 \times C 2×2×C, 而且蓝色部分之间是相互对应的. 设想, 我们将 16 × 16 16 \times 16 16×16的图片通过sliding windows (stride=2)可以划分出四幅图片, 而这四个图片经过网络所得到的logits正好是最后输出的 2 × 2 2\times 2 2×2中所对应的位置, 这意味着我们一次性计算了所有的windows, 但是计算量却并没有太多增加.

那么, 相应的windows是怎么划分的呢?

倘若网络每一层的核的stride为 s 1 , s 2 , ⋯   , s k s_1, s_2, \cdots, s_k s1,s2,,sk, 那么windows之间的stride应该为
s 1 × s 2 × ⋯ × s k . s_1 \times s_2 \times \cdots \times s_k. s1×s2××sk.

注: stride是固定的, 但是图片的大小不一定固定, 像ResNet, 由于全连接层前有一个average pooling的操作, 故我们可以传入大小不定的图片进去.

问: 但是有些卷积核还有padding的操作, 这个该如何理解呢?(小误差?)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值