BP反向传播算法原理

BP 反向传播算法原理学习

学习神经网络涉及到梯度消失、爆炸这块,搜寻一些资料加上个人理解,整理如下,以备后期复习。如能得到斧正,不胜感激!

变量定义

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
关于这里的推导我是这样理解的:

在这里插入图片描述 都有直接的运算关系,求损失函数对每层的具体某个权重偏导数,就可以直接通过
在这里插入图片描述这样的链式法则求得。在这里插入图片描述这个偏导数相对好求(是由l-1层的输出 a 与 l层的权重 线性加权 得到 Z),而 在这里插入图片描述则需要从最后一层往前一层传递,逐层计算。为什么呢?接着看下面
为了与公式中保持一致,将图中的序号变换一下:
在这里插入图片描述 在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

     参数更新算法:

在这里插入图片描述
ps:本人用Typora编辑的,图片到此处怎么这幅德行,服了自己的编排能力了!
reference:

一文弄懂神经网络中的反向传播法——BackPropagation

Neural Networks and Deep Learning

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值