机器学习二------前向传播过程反向传播算法（BP算法）Dropout 梯度消失和梯度爆炸

最新推荐文章于 2024-05-22 11:01:29 发布

My secret

最新推荐文章于 2024-05-22 11:01:29 发布

阅读量3k

点赞数 2

文章标签： html5 机器学习 html

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44068512/article/details/120475490

版权

本文深入探讨了深度学习的基础概念，包括前向传播过程、反向传播算法（BP算法）、优化算法如SGD、Momentum以及Dropout技术。解释了Dropout如何缓解过拟合，以及归一化在加速梯度下降和提高精度方面的作用。同时，讨论了深度学习中梯度消失和梯度爆炸的问题及其成因。

摘要由CSDN通过智能技术生成

1.前向传播过程

思想：将上一层的输出作为下一层的输入，并计算下一层的输出，一直到运算到输出层为止。

对于Layer 2的输出

对于Layer 3的输出，

简化后的形式就是：

2.反向传播算法（BP算法）

符号说明：

preview

对应网络如下：

preview

其中对应的矩阵表示如下：

正向传播计算过程：

同理：

所以最终的损失为：

接着推导反向传播，根据公式我们知道：

我们需要求出C对w的偏导，则根据链式法则有：

同理也有：

同理如下：

最低0.47元/天解锁文章

关注

2
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
机器学习二------前向传播过程反向传播算法（BP算法）Dropout 梯度消失和梯度爆炸

1.前向传播过程 ajl为第l层第j个神经元的激活值（激活函数的输出)，不难看出，ajl的值取决于上一层神经元的激活：将上式重写为矩阵形式：为了方便表示，记为每一层的权重输入， (2)式则变为　　利用 (2)式一层层计算网络的激活值，最终能够根据输入 X得到相应的输出Y'。2.反向传播过程反向传播过程中要计算，我们先对代价函数做两个假设，以二次损失函数为例：其中n为训练样本x的总数，y=y(x)为期望的输出，即ground truth，L为网络的层数，为...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。