【深度学习基础】后向传播算法手推

最新推荐文章于 2024-01-31 10:26:24 发布

Dream_Poem

最新推荐文章于 2024-01-31 10:26:24 发布

阅读量361

点赞数

文章标签：深度学习算法机器学习

本文链接：https://blog.csdn.net/Dream_Poem/article/details/126146428

版权

深度学习反向传播梯度更新 logistic回归激活函数

关键词由CSDN通过智能技术生成

对于1个样本，其前向传播图为：
在这里插入图片描述
下面计算反向传播过程：

假设logistic回归与激活函数如下：

$L(a,y)=-(y\log (a)+(1-y)\log (1-a)) \\ a=\sigma (z)=\frac{1}{1+e^{-z}} \\ a'=\sigma (z)(1-\sigma (z)) = a(1-a)$

第一步：

$da=\frac{dL(a,y)}{da} =-\frac{y}{a}+\frac{1-y}{1-a}$

第二步：

$dz=\frac{dL}{dz}=\frac{dL}{da}\frac{da}{dz}$

$\begin{aligned} dz&=(-\frac{y}{a}+\frac{1-y}{1-a})(a(1-a)) \\ &=a-y \end{aligned}$

第三步：

$dw_1=x_1dz \\ dw_2=x_2dz \\ db=dz$

故最后的梯度更新为（ $\alpha$ 为学习率）：

$w_1=w_1-\alpha dw_1 \\ w_2=w_2-\alpha dw_2 \\ b=b-\alpha db$

对于m个样本：

$J(w,b)=\frac{1}{m}\sum^m_{i=1}L(a^{(i)},y^{(i)})$

加右上角标即可。

伪代码【可以使用向量化减少显式循环】：

J = 0; 
dw_1 = 0; dw_2 = 0; db = 0;
for i=1 to m:
    z[i] = w*x[i]+b
    a[i] = sigmoid(z[i])
    J += logistic(a[i],y[i])
    dz[i] = a[i]-y[i]
    # 这里如果有多个特征w，仍然需要嵌套循环
    dw_1 += x_1[i]*dz[i]
    dw_2 += x_2[i]*dz[i]
    db += dz[i]
J /= m;
dw_1 /= m; dw_2 /= m; db /= m;

w_1 = w_1 - a*dw_1 
w_2 = w_2 - a*dw_2 
b = b - a*db

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Dream_Poem

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

深度学习算法工程师常用基础面试题汇集

FPGA/MATLAB学习教程/源码/项目合作开发

10-10

725

rcnn、fatse rcnn、fatser rcnn、mask rcnn的原理？介绍resnet和GoogLeNet中的inception module的结构？如何从偏差和方差的角度解释bagging和boosting的原理？word2vec的原理，glove的原理，fasttext的原理？多个隐层实现包含n元输入的任意布尔函数，需要多少节点和网络层？他们的系列改进方法是啥？dropout和BN 在前向传播和方向传播阶段的区别？和Xgboost的区别联系？常用的损失函数有哪些？有什么代表性的模型和方法？

深度学习最全面试题总结（一）

热门推荐

专注大数据与人工智能技术分享，欢迎私信加群互相学习！

05-04

2万+

导读：本系列深度学习面试题系列总结，资料集合包含机器学习、深度学习等各系列常见问题，可配合下列资料一起学习，内容参考Github及网络资源，仅供个人学习。侵权联系删除！

参与评论您还未登录，请先登录后发表或查看评论

《深度学习》手推笔记（公式手推）

06-10

----------------------------------- 第一部分 机器学习基础第一章前言第二章线性代数第三章概率论第四章数值计算第五章 机器学习基础 ------------------------------------- 第二部分深度神经网络核心知识第六章前馈神经网络第七章正则化方法第八章优化方法第九章卷积神经网络第十章循环神经网络第十一章实战经验第十二章 深度学习应用 ------------------------------------- 第三部分 深度学习前沿研究第十三章线性因子模型第十四章自编码器第十五章表示学习第十六章结构化概率模型第十七章蒙特卡洛方法第十八章配分函数第十九章近似推断第二十章生成模型

【数据挖掘】神经网络后向传播算法向前传播输入案例计算分析 ( 网络拓扑 | 输入层计算 | 隐藏层计算 | 输出层计算 )

让学习成为一种习惯 ( 韩曙亮の技术博客 )

04-24

2012

985博士《深度学习》手推公式笔记开源PDF下载！

weixin_36896856的博客

06-02

350

前几天为大家找到的王博（Kings）的笔记【机器学习手推笔记】，大家都非常喜欢，近几天发现王博的Github又更新了深度学习版本笔记GitHub地址（点击原文阅读可直达GitHub）：h...

深度学习-后向传播算法

eyeshere的博客

09-17

1252

深度学习-后向传播算法前向传播为什么需要反向传播后向传播梯度下降[^1]链式法则一次前向传播[^2]后向传播反向传播的问题及解决方案 深度学习的第一步，一定要理解后向传播算法。前向传播 ∂C∂wj≈C(w+ϵej)−C(w)ϵ\frac{ ∂C }{ ∂wj }≈C(w+ϵej)−C(w)ϵ∂wj∂C≈C(w+ϵej)−C(w)ϵ 计算损失函数C关于每个权重wj 的梯度，都需要对于每一个样本计...

深度学习之神经网络传递流程

weixin_45709330的博客

05-14

2450

神经网络的传递过程 https://zhuanlan.zhihu.com/p/65472471 引用了一下知乎上一位大佬的图这是一个简单的神经网络，有两层网络组成正向传播就是我们的数据从神经网络的输入层通过神经网络传输到输出层的过程。下面将按照顺序进行解释核心思路：传递的过程其实就是矩阵的乘法以及计算加权平均后经过激活函数就完成了一次传递，以此类推进行传递 1.数据输入网络输入层：输入层中输入的是一些矩阵，比如可以输入(1，2)(1，2)(1，2)这个点坐标作为一个数据，也可以输入一张2

深度学习：蒲公英书手推

09-01

邱锡鹏教授的《神经网络与深度学习》手推笔记可能涵盖了这些基础知识，同时也可能深入到深度学习的高级主题，如深度强化学习、生成对抗网络（GAN）和无监督学习等。通过这份笔记，读者不仅可以了解理论知识，还能...

《深度学习》花书手推笔记.zip

最新发布

02-04

2. **反向传播**：是深度学习中计算梯度的主要方法，用于更新网络权重以最小化损失函数。 3. **卷积神经网络CNN**：专门用于图像处理，其核心是卷积层和池化层，能够捕捉局部特征并实现平移不变性。 4. **循环神经...

算法面试八股文『基础知识篇』

SG_teresa's blog

01-31

2720

个人整理的算法面试基础知识八股文，内容较详细。

反向传播算法图解

08-02

深度学习

手推前向与后向传播

tbw5201的博客

01-20

148

机器学习基础 - [第6章：神经网络参数的反向传播算法]（2）后向传播算法

Olivaf的博客

07-02

321

1、梯度计算在最小化神经网络的代价函数时，我们可以采用之前的提到的任意一种优化算法，比如梯度下降。而使用这些优化算法最重要的就是计算代价函数对于各个参数的偏导项∂J(Θ)∂Θij(l)\frac{\partial J(\Theta)}{\partial{\Theta^{(l)}_{ij}}}∂Θij(l)∂J(Θ)。接下来我们看看后向传播算法是怎么计算这些偏导项的。 (1)给定一个训练样本(...

深度学习笔记——手稿推导BP算法（附代码实现）

weixin_40730615的博客

09-06

568

相信很多小伙伴在学习深度学习的过程中，都无法逃避BP（Back Propagation）反向传播算法，确实是ML、DL的经典算法之一。此处假设你对BP已经有了神经网络的基本概念，并且最好已经看过BP算法。接下来将是简洁而详细的手推过程。看完这篇文章后，能够帮助你弄懂BP算法的具体流程，以及BP算法的数学推导过程。神经网络BP算法例子神经网络FP、BP的推算过程：（原理不难，对上号代公式即可） ...

多层感知机的推导：反向传播算法的实现

weixin_62637793的博客

01-26

1688

tensflow和pytorch是自动求导的，看不到求导的过程，所以我们在这里用numpy推导一下多层感知机的求导过程。以手写数字识别为例，做一个三层的神经网络。分别是输入层，隐藏层，输出层，激活函数使用sigmod函数。矩阵相乘，参考下方梯度的符号就是nabla，就是数学中的本次采用的感知机结构的公式如下图写出上述结构的反向传播算法的函数 import numpy as np # 根据公式定义sigmoid def sigmoid(z): return.

吴恩达深度学习笔记(22)-深层神经网络说明及前后向传播实现

Harpoon_fly的博客

12-08

830

深层神经网络（Deep L-layer neural network）目前为止我们已经学习了只有一个单独隐藏层的神经网络的正向传播和反向传播，还有逻辑回归，并且你还学到了向量化，这在随机初始化权重时是很重要。目前所要做的是把这些理念集合起来，就可以执行你自己的深度神经网络。复习下前面21个笔记的内容：逻辑回归，结构如下图左边。一个隐藏层的神经网络，结构下图右边：注意，神经网络的层数是这...

吴恩达DeepLearning第一部分作业week3——实现后向传播

qq_30805765的博客

04-09

1037

花了大半天时间完成了手推反向和找bug，不得不说这个反向是真的恶心，特别要注意维数的变化。DeepLearning学习又前进一大步。这次作业要求：构建具有单隐藏层的二分类神经网络。使用具有非线性激活功能激活函数计算交叉熵损失（损失函数）。实现向前和向后传播正式开始首先，导入数据和包：导入包 import planar_utils import testCases #以上是作业提供的py文件 import numpy as np import matplotlib.pyplot

深度学习向量化(还有前向传播后向求导的详细推导)

m0_56512537的博客

08-06

950

每日一学———深度学习中的向量化作用当处理大数据时，若使用for循环多次运算，因为迭代次数很多，运算速度往往会非常慢，从而花费许多时间，在线性代数中，数据经常利用向量和矩阵处理，实际上多个列向量或行向量拼凑在一起，就成了矩阵，在python的numpy库中有专门用于矩阵运算的模块，linalg model，有很多内置函数可以取代for循环，加快运算。举个例子。 #比较for循环和numpy中内置函数的dot()的速度 ---用于计算矩阵的乘法 import numpy as np #导入n

深度学习反向传播公式推导

牵着蜗牛_去散步

08-02

1276

损失函数我们在逻辑回归中用到的损失函数是：为什么要用这个函数作为逻辑损失函数？当我们使用平方误差作为损失函数的时候，你会想要让这个误差尽可能地小，对于这个逻辑回归损失函数，我们也想让它尽可能地小，为了更好地理解这个损失函数怎么起作用，举两个例子：当y = 1时损失函数，如果想要损失函数尽可能得小，那么就要尽可能大，因为 sigmoid 函数取值[0,1]，所以会无限接近于...