深度学习前向传播与后向传播实例推导

最新推荐文章于 2024-03-05 18:06:18 发布

磊，，北

最新推荐文章于 2024-03-05 18:06:18 发布

阅读量867

点赞数 1

分类专栏：深度学习文章标签：深度学习前向传播后向传播

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43561314/article/details/99703355

版权

深度学习专栏收录该内容

18 篇文章 0 订阅

订阅专栏

举例：假设一个有两个隐藏层，每个隐藏层有一个神经元且接着一个sigmoid激活函数的神经网络例子，输入为x0,输出为pre，真实值为rel,经过第一个线性层为x11,第一个激活函数为x12;第二个线性层为x21,第二个激活函数为x22

一、

1.

首先需要知道输出：pre = sig(w2*sig(w1*x0+b1)+b2) = sig(w2*x12+b2) , x12 = sig(w1*x0+b1)

权重更新公式：w-a*df/dw （a为梯度的学习率） ,激活函数sig(x)=1/（1+exp(-x)）对x求导为 sig(x)*(1-sig(x))

损失值为L2：loss = (pre-rel)**2

2.

1.计算w2权重更新变化值：df/dw2 = (dloss/dpre) * (dpre/dw2) = 2*(pre-rel) * sig(w2*x12+b2) * (1-sig(w2*x12+b2)) * x12

2.计算w1权重更新变化值：df/dw1 = (dloss/dpre) * (dpre/dx12) * (dx12/dw1) = (dpre/dx12) * sig(w1*x0+b1) * (1-sig(w1*x0+b1)) * x0 = 2*(pre-rel) * [ sig(w2*x12+b2) * (1-sig(w2*x12+b2)) ] * w2 * [sig(w1*x0+b1) * (1-sig(w1*x0+b1)) ] * x0

为简化方程： df/dw1 = (pre-rel) * A * w2 * B *x0 , df/dw1 = (pre-rel) * A * x12

其中 A，B 为sigmoid激活函数的偏导，恒大于 0 且小于0.25

二、结合图形描述：

三、多样本、多输入情况

假设将多个样本同时输入，即设样本数为m;且一次有多个输入值，即特征数为n。神经网络有2个隐藏层，第一层m1个神经元，第二层m2个神经元。

前向传播：

1.输入矩阵为 X 大小为（输入特征数，输入样本数）即（n , m）

2.W1T（T为转置）大小为（当前层神经元数，当前层输入特征数）即（m1,n）b1 (当前神经元数，样本数) 即（m1,m）

3.W2T（T为转置）大小为（当前层神经元数，上一层神经元数）即（m2,m1）b1 (当前神经元数，样本数) 即（m2,m）

后向传播：

dw1 和 dw2 分别与 w1,w2 有相同的形状大小，且dw1,与dw2都是由m个样本的变化值平均而来即（1/m）

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习前向传播与后向传播实例推导

举例：假设一个有两个隐藏层，每个隐藏层有一个神经元且接着一个sigmoid激活函数的神经网络例子，输入为x0,输出为pre，真实值为rel,经过第一个线性层为x11,第一个激活函数为x12;第二个线性层为x21,第二个激活函数为x22一、1.首先需要知道输出：pre= sig(w2*sig(w1*x0+b1)+b2) = sig(w2*x12+b2) , x12 = s...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。