反向传播公式推导与计算图表示

最新推荐文章于 2024-05-01 17:26:11 发布

1只小包子

最新推荐文章于 2024-05-01 17:26:11 发布

阅读量2.5k

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a940902940902/article/details/81952223

版权

计算图模型与反向传播

前向传导与反向传导的区别是前向传导是计算每一个输入对于每一个节点的影响（计算∂/∂X，其中X表示输入），反向传导计算每一个节点对于每一个输出的影响（∂Y/∂，Y表示每一个输出）之所以反向传播比前向传播计算效率要高的多，是因为在神经网络中一般而言输入节点个数远远要大于输出节点个数（当然如果是输出节点个数远远大于输入节点的时候前向传导效率要高于反向传导但是基本不存在这样的情形），在神经网络中把损失看做是权重的函数，需要计算损失关于权重的偏导，而权重的个数百万，千万甚至过亿级别，这时使用反向传播可以大大减少运算量。
通过计算图模型说明前向传播与反向传播的性能区别，例如 F=Q*Z Q=x+y X=2 Y=5 Z=-4 ，输入节点为X，Y，Z 输出节点为F。
其反向传播计算图模型如下：
这里写图片描述
只需进行一遍偏导计算，就可以根据链式法则得到F关于X，Y，Z的全部偏导数
如果采用前向传播
则需要分别对于X，Y, Z进行偏导运算，这里以X举例

采用链式法则将三个支路相加得到F对于X的偏导，同理对于Y和Z也是

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
反向传播公式推导与计算图表示

计算图模型与反向传播前向传导与反向传导的区别是前向传导是计算每一个输入对于每一个节点的影响（计算∂/∂X，其中X表示输入），反向传导计算每一个节点对于每一个输出的影响（∂Y/∂，Y表示每一个输出）之所以反向传播比前向传播计算效率要高的多，是因为在神经网络中一般而言输入节点个数远远要大于输出节点个数（当然如果是输出节点个数远远大于输入节点的时候前向传导效率要高于反向传导但是基本不存在这样的...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。