深度学习基础系列：DenseNet

最新推荐文章于 2022-09-21 22:29:27 发布

zsddragon

最新推荐文章于 2022-09-21 22:29:27 发布

阅读量562

点赞数

分类专栏：深度学习基础

本文链接：https://blog.csdn.net/zsddragon/article/details/98657931

版权

本文介绍了DenseNet，一种在CVPR2017获得最佳论文的深度学习模型。DenseNet通过特征重用和旁路连接缓解了梯度消失问题，减少了参数数量，并提高了网络训练的效率。它使用紧密连接结构，每个层的输出与后续所有层相连，以增强特征复用。此外，DenseNet还包含瓶颈层和过渡层以压缩参数和降低冗余。

摘要由CSDN通过智能技术生成

深度学习基础系列：DenseNet

DenseNet概述
作为CVPR2017年的Best Paper, DenseNet脱离了加深网络层数(ResNet)和加宽网络结构(Inception)来提升网络性能的定式思维,从特征的角度考虑,通过特征重用和旁路(Bypass)设置,既大幅度减少了网络的参数量,又在一定程度上缓解了gradient vanishing问题的产生.结合信息流和特征复用的假设,DenseNet当之无愧成为2017年计算机视觉顶会的年度最佳论文.

卷积神经网络在沉睡了近20年后,如今成为了深度学习方向最主要的网络结构之一.从一开始的只有五层结构的LeNet, 到后来拥有19层结构的VGG, 再到首次跨越100层网络的Highway Networks与ResNet, 网络层数的加深成为CNN发展的主要方向之一.

随着CNN网络层数的不断增加,gradient vanishing和model degradation问题出现在了人们面前,BatchNormalization的广泛使用在一定程度上缓解了gradient vanishing的问题,而ResNet和Highway Networks通过构造恒等映射设置旁路,进一步减少了gradient vanishing和model degradation的产生.Fractal Nets通过将不同深度的网络并行化,在获得了深度的同时保证了梯度的传播,随机深度网络通过对网络中一些层进行失活,既证明了ResNet深度的冗余性,又缓解了上述问题的产生. 虽然这些不同的网络框架通过不同的实现加深的网络层数,但是他们都包含了相同的核心思想,既将feature map进行跨网络层的连接.

DenseNet作为另一种拥有较深层数的卷积神经网络,具有如下优点:
(1) 相比ResNet拥有更少的参数数量.
(2) 旁路加强了特征的重用.
(3) 网络更易于训练,并具有一定的正则效果.
(4) 缓解了gradient vanishing和model degradation