深入解析DenseNet(含大量可视化及计算)

最新推荐文章于 2022-03-15 18:55:47 发布

算法Lab

最新推荐文章于 2022-03-15 18:55:47 发布

阅读量219

点赞数

分类专栏：计算机视觉_深度学习

原文链接：https://zhuanlan.zhihu.com/p/141178215

版权

计算机视觉_深度学习专栏收录该内容

13 篇文章 6 订阅

订阅专栏

转载自 https://zhuanlan.zhihu.com/p/141178215 侵删

在DenseNet出现之前,CNN的进化一般通过层数的加深(ResNet)或者加宽(Inception)的思想进行,DenseNet通过对特征的复用提出了一种新的结构,不但减缓了梯度消失的现象参数量也更少.本文通过大量可视化以及参数计算来进行讲解.

目录

背景
DenseBlock
非线性组合函数
Transition层
整个结构的计算
DenseNet的思考
参考

背景

当CNN的层数变深时,输出到输入的路径就会变得更长,这就会出现一个问题:梯度经过这么长的路径反向传播回输入的时候很可能就会消失,那有没有一种方法可以让网络又深梯度又不会消失?DenseNet提出了一种很简单的方法,DenseNet直接通过将前面所有层与后面的层建立密集连接来对特征进行重用来解决这个问题,连接方式可以看下面这张图:

我们可以看到每一层的输出都连接到了后一层,这样对于一个L层的网络来说就会有L(L+1)/2个连接,这里看完有些摸不着头脑没关系,接下来我们会具体展开.

Dense Block

Dense Block是DenseNet的一个基本模块,这里我们从一般的神经网络说起:

.

这里要注意,因为我们是直接跨通道直接做concat,所以这里要求不同层concat之前他们的特征图大小应当是相同的,所以DenseNet分为了好几个Dense Block,每个Dense Block内部的feature map的大小相同.而每个Dense Block之间使用一个Transition模块来进行下采样过渡连接,这个后文会介绍.

非线性组合函数

在刚才Dense Block中的非线性组合函数是指BN+ReLU+3x3 Conv的组合,但是出于减少参数的目的,一般会先加一个1x1的卷积来减少参数量.所以我们的非线性组合函数就变成了BN+ReLU+1x1 Conv+BN+ReLU+3x3 Conv的结构.

Transition层

整个结构的计算

我们通过一张总的参数计算图过一遍整个DenseNet:

这张参数图很清晰地描述了从单一Dense Block,到内部经过非线性组合函数,再通过Transition层下采样后再连接到下一个Dense Block的计算.

DenseNet的思考

更强的梯度流动

DenseNet可以说是一种隐式的强监督模式,因为每一层都建立起了与前面层的连接,误差信号可以很容易地传播到较早的层,所以较早的层可以从最终分类层获得直接监管。

参数更少计算效率更高

保存了低维度的特征

在标准的卷积网络中,最终输出只会利用提取最高层次的特征.

而在DenseNet中,它使用了不同层次的特征,它倾向于给出更平滑的决策边界。这也解释了为什么训练数据不足时DenseNet表现依旧良好。

参考

paperhttp://www.pabloruizruiz10.com/resources/CNNs/DenseNets.pdf
作者在CVPR17的演讲https://www.youtube.com/watch?v=-W6y8xnd--U&t=163s
Pablo Ruiz's bloghttps://towardsdatascience.com/understanding-and-visualizing-densenets-7f688092391a

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深入解析DenseNet(含大量可视化及计算)

转载自https://zhuanlan.zhihu.com/p/141178215 侵删在DenseNet出现之前,CNN的进化一般通过层数的加深(ResNet)或者加宽(Inception)的思想进行,DenseNet通过对特征的复用提出了一种新的结构,不但减缓了梯度消失的现象参数量也更少.本文通过大量可视化以及参数计算来进行讲解.目录背景 DenseBlock 非线性组合函数 Transition层整个结构的计算 DenseNet的思考参考背景当CNN的层数变深时,..
复制链接

扫一扫

专栏目录

算法Lab CSDN认证博客专家 CSDN认证企业博客

码龄7年

23: 原创

30万+: 周排名

2万+: 总排名

18万+: 访问

: 等级

898: 积分

103: 粉丝

205: 获赞

35: 评论

1134: 收藏

私信

关注

热门文章

分类专栏

最新评论

GIMP中的Noise Reduction算法原理及快速实现
江流儿abcd: 您好，您说您研究了色温算法，方便请教一下吗？
深度学习入门之池化层浅析
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
深度学习中的小tips
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)增加条理清晰的目录；(3)使用更多的站内链接。
基于DCT变换图像去噪算法的进一步优化（100W像素30ms）
普通网友: 我猜是数据计算速度更快吧,毕竟是平方,基数越小越快
语义分割推理-大图像分割成多patch推理后拼接的方法----探究
magesty: 你好，能否提供参考代码学习一下，非常感谢！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。