残差网络理解（简略）

最新推荐文章于 2022-03-09 17:59:58 发布

今天不标数据的小wu

最新推荐文章于 2022-03-09 17:59:58 发布

阅读量549

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42316533/article/details/117200642

版权

残差网络梯度消失深度学习神经网络模型训练

关键词由CSDN通过智能技术生成

在这里插入图片描述
x是初始的输入（也可能是上一层的输入），红框里面是两层神经网络，假设这两层网络的输出为F(x)，将F(x)与x相加作为下一层网络的输入。这就是残差网络。
为什么残差结构有用呢？

比如这张图，A对应着上一张图的x，B和C是两层神经网络，D是下一层网络。
在这里插入图片描述
注意到最后的梯度中红框中的公式为：1+…，即使后面的梯度为0，整个梯度也不会消失，因此很好地解决了梯度消失的问题，利用残差网络可以构建深层的网络而不担心因为梯度累乘带来的梯度消失问题。

今天不标数据的小wu

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
残差网络理解（简略）

x是初始的输入（也可能是上一层的输入），红框里面是两层神经网络，假设这两层网络的输出为F(x)，将F(x)与x相加作为下一层网络的输入。这就是残差网络。为什么残差结构有用呢？比如这张图，A对应着上一张图的x，B和C是两层神经网络，D是下一层网络。注意到最后的梯度中红框中的公式为：1+…，即使后面的梯度为0，整个梯度也不会消失，因此很好地解决了梯度消失的问题，利用残差网络可以构建深层的网络而不担心因为梯度累乘带来的梯度消失问题。...
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。