DenseNet翻译

最新推荐文章于 2024-06-11 11:18:50 发布

houxy12

最新推荐文章于 2024-06-11 11:18:50 发布

阅读量917

点赞数 1

本文链接：https://blog.csdn.net/dlfxjc2/article/details/88692832

版权

摘要

近期的研究发现，如果在靠近输入和靠近输出的层之间存在连接的话，卷积神经网络可以更深，更加准确，并且能够更有效地进行训练。本文提出DenseNet。每一层与其他层之间使用反馈的方式进行连接。传统的L层卷积神经网络有L个连接，DenseNet有L(L+1)/2个直接连接。对于每一层，前面层的所有特征图作为输入，输出的特征图作为之后层的输入。DenseNet有以下几个优势：能够有效缓和梯度消失问题，增强特征传输，特征复用，同时减少参数的个数。在四个主要的目标识别任务上进行验证，DenseNet的结果在大多数的数据集上表现较好，在实现较高准确率的基础下，减少计算量。

Introduction

目前存在的问题：随着卷积层深度的增加，关于输入的信息或者梯度传递多层，在到达网络最后时，很有可能出现梯度小时和梯度爆炸现象。目前的方法例如ResNet能够减少这种现象，但都需要从前面的层到后面的层之间建立连接。

本文提出一种简单的连接模式，为了保证在网络中最大的信息流，将所有的层进行直接连接（匹配的特征图大小）。为保留反馈特征，每一层从前面的所有层获取输入，然后将其输出的特征图作为后面层的输入。与ResNet对比，没有使用求和来进行特征的连接，而是进行级联（concatenating）。因此，第l 层有l个输入，包括前面所有卷积模块的feature map。

Densenet的连接方式使得其比传统的卷积网络需要更少的参数，因为不需要对冗余的feature map重复进行学习。传统的反馈结构可以看作是一个状态，在层与层之间进行传递，每个层从前面的层读入状态并写入后面的层。在改变状态的同时保留有用的信息。ResNet通过额外的输入变换来保留信息，ResNet的一些变形算法发现，很多层的贡献比较小，在训练过程中可以随机drop。这使得ResNet与RNN相似，但是ResNet网络的参数很多，因为每一层都有权重。DenseNet 探索增加到网络的信息以及保留的信息之间的区别。将一小部分的特征图作为额外信息增加到网络，并维持保留信息不变，最终的分类器基于所有的特征图进行决策。

除了参数的有效性，DenseNet的另一个优势是，对于网络的信息以及梯度数据流进行优化，使得训练更容易。每一层能够直接获取损失函数的梯度以及输入的原始信号，因此网络的层次可以加深。另外，Dense连接方式具有正则化效果，减少过拟合。

DenseNet

一幅图片输入一个层卷积神经网络，每一层都有一个非线性变换，表示层的索引，可以是BN，RELU，Pooling，或者卷积的混合操作符，第层的输出为。

ResNets

传统卷积神经网络将第层的输出作为第层的输入，表达式为：，ResNet增加了跨层连接， ResNet能够将梯度从后面层直接传递给前面层，但是identity函数和Hl的输出是使用加法进行连接，在网络中可能会阻碍信息流的的传播。

Dense连接

此时l层的表示为：

表示层的特征图。

混合函数

表示三个操作的混合：BN，RELU，以及3x3的卷积。

池化层

当特征图的大小改变时，连接操作不可行。但是下采样能够改变feature map的大小。为了应用下采样技术，将网络分成不同的dense模块。将block之间层成为过渡层，进行卷积和池化操作。在本文中使用的过渡层包括：一个BN层，一个1x1卷积层以及一个2x2的平均池化层。

增长速度

如果每个产生k个特征图，则第l层一共有个输入特征图，k0为输入层的通道数。与已经存在的网络相比，DenseNet有更窄的层，比如k=12。将超参数k作为网络的增长速度，后续实验环节证明很小的增长速度就能够达到很好的效果。对此，可以解释为每一层都能够获取之前的曾的feature map，以及网络的“集体智慧”。可以将feature map作为网络的全局状态。每一层将其输出的k个特征图添加到这个状态中，增长率对每一层增加到全局状态的信息进行约束。全局信息已经写入，网络的所有层都可以获取，不需要从一个层到另外一个层进行复制。

Bottleneck层

尽管每一层都只有k个输出的feature map，但是有很多输入。1x1卷积可以作为bottleneck层放在3x3之前，来减少输入特征图的个数，因此，为了提高计算效率。本文使用的bottleneck层：BN-ReLU-Conv(1x1)-BN-ReLU-Conv(3x3)，称其为DenseNet-B。在实验中，使用1x1的卷积产生4k个feature map。

压缩

实现细节

在实验中，使用三个dense模块，每个模块有相同数量的层。在进入第一个dense模块之前，使用一个16输出通道的卷积层对输入图片进行卷积（或者对于DenseNet-BC而言是增长速度的二倍）。对于每个3x3的卷积层，每个输入都使用0填充来保持特征图的大小固定。在两个连续的dense模块之间，使用1x1的卷积和2x2的平均池化层。在最后一个dense模块后面，使用全局平均池化，然后使用softmax分类器。Dense模块的特征图大小为32x32,16x16,8x8。基础结构{L=40,k=12},{L=100,k=12},{L=100,k=24}，对于DenseNet，网络的默认参数为{L=100,k=12},{L=250,k=24},{L=190,k=40}。

在实验中，使用DenseNet-BC结构，有四个dense模块，对224*224的输入图片，最开始的卷积层2k个7x7的卷积，stride大小为2，其他所有层的feature map个数设置为k。

总结

DenseNet的优势在于

有效解决梯度消失问题
加强了特征的传播
有效地减少了网络参数
特征重用性高

参考文献

Huang G, Liu Z, Laurens V D M, et al. Densely Connected Convolutional Networks[J]. 2016.

houxy12

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
DenseNet翻译

摘要近期的研究发现，如果在靠近输入和靠近输出的层之间存在连接的话，卷积神经网络可以更深，更加准确，并且能够更有效地进行训练。本文提出DenseNet。每一层与其他层之间使用反馈的方式进行连接。传统的L层卷积神经网络有L个连接，DenseNet有L(L+1)/2个直接连接。对于每一层，前面层的所有特征图作为输入，输出的特征图作为之后层的输入。DenseNet有以下几个优势：能够有效缓和梯度消失问...
复制链接

扫一扫