深度学习笔记（三）计算图及其导数运算方法

最新推荐文章于 2022-03-02 14:08:54 发布

Mr.zwX

最新推荐文章于 2022-03-02 14:08:54 发布

阅读量645

点赞数

分类专栏：【深度学习/神经网络】Deep Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16763983/article/details/110531493

版权

【深度学习/神经网络】Deep Learning 专栏收录该内容

86 篇文章 47 订阅

订阅专栏

通过上文logistic regression的讲解知道，正向运算可以计算输出结果，而反向运算可以计算梯度或导数，从而调整参数。
通过简单的运算式引出计算图的组成，从而引出深度学习中前向传播和反向传播的运算方法。

一、计算图与正向传播

假设函数 $J (a, b, c) = 3 (a + b c) .$ 按照运算顺序我们令， $u = b c, v = a + u, J = 3 v .$
ps.如果学过高等数学中的多元微积分，那么以下内容均可以类比多元微分学中的链式求导法则（chain rule），于是得到如下图（其实正向计算即分布计算过程）：
在这里插入图片描述
分布计算的过程比较容易，交给计算机完成会更加高效，所以这部分略。

二、计算导数与反向传播

在这里插入图片描述
$\frac{dJ}{dv}=3,\frac{dv}{da}=1.$

$\frac{dJ}{da}=\frac{dJ}{dv} \frac{dv}{da}=3\times1=3.$

$\frac{dJ}{dv}=3,\frac{dv}{du}=1.$

$\frac{dJ}{du}=\frac{dJ}{dv} \frac{dv}{du}=3\times1=3.$

$\frac{dJ}{db}=\frac{dJ}{dv} \frac{dv}{du} \frac{du}{db}=3\times1 \times 2=6.$

三、编程符号规定

求导时， $\frac{dFinalOutputVar}{dvar}$ 表示最终输出变量对某个相关变量的导数。编程时，为了方便并统一表示这个求导变量，引入变量名：
$d v a r .$
例如， $\frac{dJ}{du}\to du,\frac{dJ}{da}\to da.$ 同时，这样写也避开了中间变量。

四、总结

一个计算流程图，正向计算成本函数 $J$ ，需要优化的函数
在计算一系列导数时，最有效的办法是反向（从右到左计算），跟着红色箭头走，层层递进求导（链式）

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Mr.zwX 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。