【深度学习基础】Pytorch的动态计算图与自动求导

最新推荐文章于 2024-06-16 12:00:21 发布

铁冰ice

最新推荐文章于 2024-06-16 12:00:21 发布

阅读量113

点赞数

文章标签：深度学习 pytorch 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_59283901/article/details/133463081

版权

正向传播

一个完整的神经网络往往需要进行两个最重要的步骤

1.正向传播即带入输入的数据跑一次神经网络
2.反向传播利用损失函数更新权重

反向传播

反向传播是神经网络的核心，神经网络的精度受权重控制（w和b）一次正向传播后，往往会根据损失函数来计算调节这些权重，以保证神经网络的精度。

损失函数的值受到权重的影响，而更新权重使得损失函数的值最小化的核心算法就是梯度下降。

反向传播就是计算损失函数对于权重参数的偏导数，而很多时候损失函数关于权重来说是个嵌套的函数，需要通过链式法则来计算，而偏导数的计算又是非常复杂的，因此需要Pytorch来自动计算。

自动求导机制

直接看一个例子

使用Pytorch计算

y=2 $x^{T}$ x这个函数的各个x自变量的梯度

首先定义x矩阵，注意需要转化为浮点数

为了后面能够求梯度需要将x的require_grad属性设置为True

计算y

调用反向传播函数计算x的梯度

注意几点，y的值多了一个属性grad_fn，这个代表了x是怎么运算得到y的为后续求导提供支持。

如果不调用y.backword()，x的梯度是不会计算的，因此返回None，当调用后，即可得到x的梯度

显然可以发现由于x是列向量，而x的转置*x实际上就是x的平方因此偏导数是4x，可以发现最终的值确实是4x。

需要注意的是Pytorch采取的是动态图机制，因此backword不能再次调用了，要调用需要重新来一遍

同时如果x还要参与某个函数的计算的话需要对x的梯度进行清空，否则pytorch会默认把两次梯度进行求和。

可以发现是错的，因为y1是x的求和函数，那么实际上梯度一定为1，而上一次梯度是[0,4,8,12]显然是相加了。

有些时候如果不想进行梯度计算，可以使用with torch.no_grad，或者对x进行detch方法产生一个require_grad为False的相同的张量。

动态图机制

简单的来介绍一下Pytorch的动态图计算机制

计算图为一个有向无环图，每个节点代表一个算子，节点之间的边代表了计算方式。

或者搬运网上的说法

计算图是用来描述运算的有向无环图，有两个主要元素：

节点 (Node) ：节点表示数据，如向量、矩阵、张量。

边 (Edge)：边表示运算，如加减乘除卷积等。

与Tensorflow相比，Pytorch采取的是动态计算图机制，也就是随着创建的张量来构建动态图，因此backword之后pytorch为了节省内存而把得出的动态计算图去除了。

动态计算图的优点很明显便于操作，但是缺点是会相较慢一点。动态计算图的存在Pytorch才能跟踪每个变量的情况从而得出每个权重的梯度。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【深度学习基础】Pytorch的动态计算图与自动求导

一个完整的神经网络往往需要进行两个最重要的步骤1.正向传播即带入输入的数据跑一次神经网络2.反向传播利用损失函数更新权重。
复制链接

扫一扫

铁冰ice CSDN认证博客专家 CSDN认证企业博客

码龄3年

9: 原创

167万+: 周排名

27万+: 总排名

3185: 访问

: 等级

91: 积分

1: 粉丝

1: 获赞

4: 评论

17: 收藏

私信

关注

热门文章

最新评论

【深度学习基础】Pytorch加载MNIST数据集
CSDN-Ada助手: 恭喜您写完了第9篇博客！标题看起来很有意思，我对Pytorch加载MNIST数据集也很感兴趣。感谢您一直持续创作，分享您的知识和经验。我希望您能继续努力，分享更多深度学习的基础知识。或许下一步您可以探索一些高级的Pytorch应用或者深入解析MNIST数据集的特征。期待您的下一篇作品，谦虚的我会继续关注您的博客！
【深度学习基础】Pytorch张量的常见操作
CSDN-Ada助手: 恭喜您撰写了第7篇博客！标题看起来非常有趣，我很期待阅读您关于Pytorch张量常见操作的内容。您对深度学习基础的探索一定是非常深入的，能够写出这样的博客实属不易。在下一步的创作中，我建议您可以思考一下如何将Pytorch张量的常见操作与实际应用场景相结合，或者进一步探索一些高级的操作方法，以丰富读者的知识储备。期待您的新作品！
【二分搜索】深入二分法思想与应用，整数二分套路题精心整理
CSDN-Ada助手: 评论：非常棒的博文！你对二分法思想与应用进行了深入的探讨，并且还整理了一些整数二分套路题，非常有实用性。继续努力写作，期待你的更多精彩分享！另外，除了归并排序、快速排序和线段树，还有一些和二分法相关的知识和技能可以拓展。例如，在二分法的应用中，有时需要注意边界条件的处理，防止出现错误的结果。此外，你还可以深入探索二分法在搜索问题、图论问题中的应用，以及二分法的变体，如三分法、倍增法等。希望这些内容能够对你的学习和写作有所帮助。再次感谢你的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
字符串模式匹配经典算法KMP算法及其Python代码实现
CSDN-Ada助手: 非常感谢您分享关于KMP算法的博客！您的持续创作令人欣喜，对于学习者来说，这样的文章真是太有价值了。在阅读您的博客后，我对KMP算法有了更深入的理解，而且您的Python代码实现也让我受益匪浅。不过，如果您愿意的话，我希望您能够在下一篇博客中分享一些实际应用场景，以便更好地理解KMP算法在实际编程中的使用。期待您的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。