【深度学习 反向传播算法01】什么是反向传播算法? (求解梯度-链式求导法则)

反向传播算法本文是根据深度学习课程图文做的笔记0. 背景简单深度学习模型的基本流程: 1. 定义模型 2. 读入数据 3. 给出损失函数f 4. 梯度下降法更新参数(手动求梯度、pytorch自动求导)对于复杂模型,如100层网络,该怎么解决呢?⭐反向传播算法自动求导的本质就是反向传播算法反向传播算法是一个有效求解梯度的算法,本质是链式求导法则的应用1. 链式法则利用链式求导法则:令 q=x+y它们的微分:又因为 q = x +y则:..
摘要由CSDN通过智能技术生成

反向传播算法

本文是根据深度学习课程图文做的笔记

0. 背景

  • 简单深度学习模型的基本流程:

      1. 定义模型
      2. 读入数据
      3. 给出损失函数f
      4. 梯度下降法更新参数(手动求梯度、pytorch自动求导)
    

对于复杂模型,如100层网络,该怎么解决呢?
⭐反向传播算法

  • 自动求导的本质就是反向传播算法
  • 反向传播算法是一个有效求解梯度的算法,本质是链式求导法则的应用

1. 链式法则

在这里插入图片描述
利用链式求导法则:令 q=x+y
在这里插入图片描述
它们的微分:

在这里插入图片描述
又因为 q = x +y
在这里插入图片描述
则:在这里插入图片描述
链式法则/反向传播算法的核心:
如果需要对式子中元素求导,可以一层一层的求导然后将结果相乘

2. 反向传播算法

反向传播算法是链式法则的应用
q = x + y f = qz
在这里插入图片描述
绿色:数值 红色:求出的梯度
从最后开始的梯度是1 :从后往前
f 对 q 和z 进行求导
在这里插入图片描述
接下来利用链式法则,q对x和y求导

在这里插入图片描述
反向传播算法:每次求导只对当前的运算求导
求解每层网络的参数都是用链式法则将前面的结果输出迭代到这一层,即一个传播的过程

3. Sigmoid函数示例反向传播的过程

在这里插入图片描述
需要求解:

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值