深度学习中的highway network、ResNet、Inception

最新推荐文章于 2024-06-15 09:46:51 发布

最小森林

最新推荐文章于 2024-06-15 09:46:51 发布

阅读量2w

点赞数 27

分类专栏：深度学习文章标签： highway ResNet Inception 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012052268/article/details/80347344

版权

本文介绍了深度学习中为解决梯度消失问题的三种网络结构：Highway Network、ResNet和Inception。Highway Network引入门控机制，保留更多信息；ResNet通过残差学习，避免退化问题；Inception通过多尺度特征提取和通道减少，实现高效深度学习。

摘要由CSDN通过智能技术生成

文章目录

概念
- CNN演化
- 梯度消失
highway network
- 公式：
- 意义、好处
ResNet
Inception

不是特别清楚这三个流行且有用的模型（或者说层）的具体作用和使用方法。

概念

CNN演化

先引入一张CNN结构演化图：

2012年AlexNet做出历史突破以来，直到GoogLeNet出来之前，主流的网络结构突破大致是网络更深（层数），网络更宽（神经元数）。所以大家调侃深度学习为“深度调参”，但是纯粹的增大网络的缺点：

参数太多，容易过拟合，若训练数据集有限；
网络越大计算复杂度越大，难以应用；
网络越深，梯度越往后穿越容易消失（梯度弥散），难以优化模型

梯度消失

我们都知道神经网络中会使用非线性变换。

一般会使用sigmoid函数，得到，这个函数会把数据压缩到开区间(0，1)，函数的图像如下：

可以看到，函数的两侧非常平滑，而且无限的接近0和1，仅仅是中间部分函数接近一条直线。

要知道，神经网络训练的方法是BP算法（反向传播）。BP算法的基础其实就是导数的链式法则，就是有很多乘法会连接在一起。

看sigmoid函数的图像知道了，值域最大是1，而且大多数值都被推向两侧饱和的区域，这些区域的导数很小。

可以预见到，随着网络的加深，梯度后向传播到输入层时，就所剩无几，基本不能引起参数W数值的扰动，这样输入层一侧的网络就学习不到新的特征了参数得不到更新）。

那么怎么办？我暂时看到了四种解决问题的办法。

最低0.47元/天解锁文章

关注

27
点赞
踩
121

收藏

觉得还不错? 一键收藏
3
评论
深度学习中的highway network、ResNet、Inception

概念CNN演化梯度消失highway network公式：意义、好处ResNet动机、目的模型作用：InceptionInception v1模型Inception V2-V3：Inception v4模型不是特别清楚这三个流行且有用的模型（或者说层）的具体作用和使用方法。概念CNN演化先引入一张CNN结构演化图： ...
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。