PyramidNet

Paper : Deep Pyramidal Residual Networks
Code : official

摘要

其实文章的核心观点与Inception提出的设计原则区别不大,Pyramid Net 认为在设计网络结构的时候,网络的宽度(通道数)应当逐渐增大,而之前的模型一般在卷积网络的前几层时通道变化幅度过大。没有提出非常创新的设计思路,个人感觉是小改动。

网络结构

In this research, instead of sharply increasing the feature map dimension at units that perform downsampling, we gradually increase the feature map dimension at all units to involve as many locations as possible.

下面使用图片直观展示ResNet和PyramidNet之间的区别

image.png

对于ResNet来说,令 D k D_k Dk表示第k个ResNet模块的宽度,则有

D k = { 16 n ( k ) = 1 16 ⋅ 2 n ( k ) − 2 n ( k ) ≥ 2 D_k = \left\{\begin{matrix} 16 & n(k)=1\\ 16 \cdot 2^{n(k)-2} & n(k) \geq 2 \end{matrix}\right. Dk={16162n(k)2n(k)=1n(k)2

其中 n ( k ) ∈ { 1 , 2 , 3 , 4 } n(k)\in \{1,2,3,4\} n(k){1,2,3,4}表示ResNet Block所在的组数。

而Pyramid Net使用的设计策略如下

D k = { 16 k = 1 ⌊ D k − 1 + α N ⌋ 2 ≤ k ≤ N + 1 D_k = \left\{\begin{matrix} 16 & k=1\\ \lfloor D_{k-1}+\frac{\alpha}{N} \rfloor & 2\leq k\leq N+1 \end{matrix}\right. Dk={16Dk1+Nαk=12kN+1

其中 α \alpha α是一常数。另有非线性的网络宽度设计策略如下

D k = { 16 k = 1 ⌊ D k − 1 ⋅ α 1 N ⌋ 2 ≤ k ≤ N + 1 D_k = \left\{\begin{matrix} 16 & k=1\\ \lfloor D_{k-1}\cdot \alpha^{\frac{1}{N}} \rfloor & 2\leq k\leq N+1 \end{matrix}\right. Dk={16Dk1αN1k=12kN+1

对比图如下

image.png

在具体实现中,PyramidNet 选用下图中(d)所示的单元作为网络组成部分,注意为了不影响准确率,Pyramid Net 移除了第一个ReLU

image.png

因为PyramidNet中每个ResNet Block的通道数是逐渐增大的,各不相同,因此简单的identity mapping shortcut不能直接使用。作者采用零填充的方式扩展通道数实现通道对齐,而下图说明零填充的shortcut等价于ResNet和普通CNN的混合

image.png

实验中,作者还发现,BN层的使用不止可以加快参数的收敛,还可以最大化单个ResNet单元的容量。在模型的每个模块后使用BN层,可以改善模型的表现。

核心观点

  1. 在PreActResNet的基础上,进一步研究了Conv BN ReLU在ResNet Block中的位置,提出了移除首部ReLU层和添加末尾BN层的新的ResNet Block结构。
  2. 提出了线性增大网络宽度,使用零填充进行shortcut连接的思路。
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值