2017-CVPR-DenseNet

最新推荐文章于 2024-08-22 08:27:09 发布

Rhine_Yu

最新推荐文章于 2024-08-22 08:27:09 发布

阅读量425

点赞数

分类专栏： Paper 文章标签： DenseNet CNN DeepLearning CVPR

本文链接：https://blog.csdn.net/rhineyu/article/details/79936839

版权

6 篇文章 0 订阅

订阅专栏

这里写图片描述

在随机深度网络（deep networks with stochastic depth）paper中，提出一种类似dropout的方法改进ResNet，作者发现在训练时每一步被随机丢掉一些层，可以显著提高ResNet的泛化性能。这带给作者两点启发：

因此，作者提出两点：

缓解梯度消失问题

把前面的层带到后面来，ResNet中“残差”思想体现。paper里说的是“create short paths from early layers to later layers”。
增强feature的传递，使feature重复利用（省计算，效率高）
减少参数数量（节省带宽，降低存储开销）

在CNN设计中，参数数量，计算力，内存占用等都是极为重要的考虑，Bottleneck layer设计（1x1卷积的使用）、down-sampling设计（stride convolution，pooling）、dropout、BN、No FC（全卷积网络的设计）等都是有利于省参数、省计算的操作。模型压缩需要重点关注一下！
抗过拟合

原因解释：神经网络每一层提取到的特征都相当于对输入数据的一个非线性变换，而随着深度的增加，变换的复杂度也逐渐增加（更多非线性函数的复合）。相比于一般神经网络的分类器直接依赖于网络最后一层（复杂度最高）的特征，DenseNet可以综合利用浅层复杂度低的特征，因而可以更容易得到一个光滑的具有更好泛化性能的决策函数。

y由于DenseNet不容易过拟合，在数据集不是很大的时候表现尤其突出。可以省略在ImageNet上的预训练，在医学图像，卫星图像等（与预训练的ImageNet自然图像有明显差别）任务上具有非常广阔的应用前景。