深度学习为什么用反向传播而不是正向传播？

最新推荐文章于 2024-06-13 11:28:52 发布

SinsNeverDie

最新推荐文章于 2024-06-13 11:28:52 发布

阅读量1.1k

点赞数 4

文章标签：神经网络人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44526168/article/details/124909607

版权

07 自动求导【动手学深度学习v2】_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1KA411N7Px/?spm_id_from=trigger_reload

对于计算复杂度来说，正向传播和反向传播都是O(n)。

但是内存复杂度来说，反向传播因为需要保留正向传播时所有的中间结果，所以需要O(n) ,这也是神经网络特别耗GPU资源（爆显存）的祸源。

正向传播内存复杂度为O(1),但每计算一个变量的梯度都要扫一遍。

反向传播从根节点向下扫，可以保证每个节点只扫一次（在计算一个变量梯度时不用管同层的其他变量）；正向传播从叶子节点向上扫，会导致上层节点可能会计算多次。

（正向中子节点比父节点先计算，因此也无法像反向那样把本节点的计算结果传给每一个子节点）

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习为什么用反向传播而不是正向传播？

07 自动求导【动手学深度学习v2】_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1KA411N7Px/?spm_id_from=trigger_reload对于计算复杂度来说，正向传播和反向传播都是O(n)。但是内存复杂度来说，反向传播因为需要保留正向传播时所有的中间结果，所以需要O(n) ,这也是神经网络特别耗GPU资源（爆显存）的祸源。正向传播内存复杂度为O(1),但每计算一个变量的梯度都要扫一遍。反向传...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。