CS231n学习笔记——反向传播

CS231n学习笔记——反向传播

首先引入计算图的概念
计算图就是用来 表示任意函数的图,图中的节点表示要执行的每一步计算,
在这里插入图片描述
图中R(W)是正则项。
一旦能用计算图来表示一个函数,那么就能使用所谓的反向传播技术递归地调用链式法则来计算计算图中每个变量的梯度。
在这里插入图片描述
可见,反向传播就是沿着计算图从输出端开始,对总结果的loss一路求导或者求偏导回到输入的变量,这样求出来的数值组合在一起就是这一次的梯度,对于每个节点我们只需要算一个简单的求导,然后通过链式法则把每一条路的上的求导乘起来即可(如图中绿色框所示)。
具体工作是:在每个节点上计算我们所需的本地梯度,然后跟踪这个梯度,在反向传播的时候我们接受从上游传回来的这个梯度值,直接用这个梯度值乘以本地梯度然后得到需要传回前一个连接点的值。

下图是一个稍微复杂点的例子,更能说明反向传播算法的优越性,用它则不需要直接进行复杂的微积分求导。
在这里插入图片描述
也可以把其中的sigmoid函数形状部分单独拿出来做一个sigmoid门。
在这里插入图片描述

在实际应用中,数据都以矩阵的形式输入和处理,以下是在矩阵运算时,反向传递法的推导:
在这里插入图片描述
其中推导过程包括以下两步。最后得出了程序中的每一个函数应该包括哪些量。
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值