【深度学习反向传播算法01】什么是反向传播算法？（求解梯度-链式求导法则）

最新推荐文章于 2024-03-06 17:02:38 发布

AD_钙

最新推荐文章于 2024-03-06 17:02:38 发布

阅读量1.8k

点赞数 1

分类专栏： # 反向传播算法深度学习文章标签：算法深度学习网络人工智能

本文链接：https://blog.csdn.net/weixin_44121966/article/details/118864425

版权

反向传播算法本文是根据深度学习课程图文做的笔记0. 背景简单深度学习模型的基本流程： 1. 定义模型 2. 读入数据 3. 给出损失函数f 4. 梯度下降法更新参数（手动求梯度、pytorch自动求导）对于复杂模型，如100层网络，该怎么解决呢？⭐反向传播算法自动求导的本质就是反向传播算法反向传播算法是一个有效求解梯度的算法，本质是链式求导法则的应用1. 链式法则利用链式求导法则：令 q=x+y它们的微分：又因为 q = x +y则：..

摘要由CSDN通过智能技术生成

反向传播算法

本文是根据深度学习课程图文做的笔记

0. 背景

简单深度学习模型的基本流程：

  1. 定义模型
  2. 读入数据
  3. 给出损失函数f
  4. 梯度下降法更新参数（手动求梯度、pytorch自动求导）

对于复杂模型，如100层网络，该怎么解决呢？
⭐反向传播算法

自动求导的本质就是反向传播算法
反向传播算法是一个有效求解梯度的算法，本质是链式求导法则的应用

1. 链式法则

在这里插入图片描述
利用链式求导法则：令 q=x+y

它们的微分：

在这里插入图片描述
又因为 q = x +y

则：
链式法则/反向传播算法的核心：
如果需要对式子中元素求导，可以一层一层的求导然后将结果相乘

2. 反向传播算法

反向传播算法是链式法则的应用
q = x + y f = qz
在这里插入图片描述
绿色：数值红色：求出的梯度
从最后开始的梯度是1 ：从后往前
f 对 q 和z 进行求导

接下来利用链式法则，q对x和y求导

在这里插入图片描述
反向传播算法：每次求导只对当前的运算求导
求解每层网络的参数都是用链式法则将前面的结果输出迭代到这一层，即一个传播的过程

3. Sigmoid函数示例反向传播的过程

在这里插入图片描述
需要求解：

最低0.47元/天解锁文章

AD_钙

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
【深度学习反向传播算法01】什么是反向传播算法？（求解梯度-链式求导法则）

反向传播算法本文是根据深度学习课程图文做的笔记0. 背景简单深度学习模型的基本流程： 1. 定义模型 2. 读入数据 3. 给出损失函数f 4. 梯度下降法更新参数（手动求梯度、pytorch自动求导）对于复杂模型，如100层网络，该怎么解决呢？⭐反向传播算法自动求导的本质就是反向传播算法反向传播算法是一个有效求解梯度的算法，本质是链式求导法则的应用1. 链式法则利用链式求导法则：令 q=x+y它们的微分：又因为 q = x +y则：..
复制链接

扫一扫