PyTorch 1.0 中文官方教程：Autograd：自动求导

最新推荐文章于 2022-12-06 11:02:16 发布

绝不原创的飞龙

最新推荐文章于 2022-12-06 11:02:16 发布

阅读量3.5w

点赞数

分类专栏： ApacheCN

ApacheCN 专栏收录该内容

228 篇文章 31 订阅

订阅专栏

译者：bat67

最新版会在译者仓库首先同步。

PyTorch中，所有神经网络的核心是autograd包。先简单介绍一下这个包，然后训练我们的第一个的神经网络。

autograd包为张量上的所有操作提供了自动求导机制。它是一个在运行时定义（define-by-run）的框架，这意味着反向传播是根据代码如何运行来决定的，并且每次迭代可以是不同的.

让我们用一些简单的例子来看看吧。

张量

torch.Tensor是这个包的核心类。如果设置它的属性 .requires_grad为True，那么它将会追踪对于该张量的所有操作。当完成计算后可以通过调用.backward()，来自动计算所有的梯度。这个张量的所有梯度将会自动累加到.grad属性.

要阻止一个张量被跟踪历史，可以调用.detach()方法将其与计算历史分离，并阻止它未来的计算记录被跟踪。

为了防止跟踪历史记录（和使用内存），可以将代码块包装在with torch.no_grad():中。在评估模型时特别有用，因为模型可能具有requires_grad = True的可训练的参数，但是我们不需要在此过程中对他们进行梯度计算。

还有一个类对于autograd的实现非常重要：Function。

Tensor和Function互相连接生成了一个非循环图，它编码了完整的计算历史。每个张量都有一个.grad_fn属性，它引用了一个创建了这个Tensor的Function（除非这个张量是用户手动创建的，即这个张量的grad_fn是None）。

如果需要计算导数，可以在Tensor上调用.backward()。如果Tensor是一个标量（即它包含一个元素的数据），则不需要为backward()指定任何参数，但是如果它有更多的元素，则需要指定一个gradient参数，它是形状匹配的张量。

import torch

创建一个张量并设置requires_grad=True用来追踪其计算历史

阅读全文／改进本文

绝不原创的飞龙

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

绝不原创的飞龙

CSDN认证博客专家 CSDN认证企业博客

码龄13年

人工智能领域优质创作者

8017: 原创

1671: 周排名

2: 总排名

5511万+: 访问

: 等级

31万+: 积分

3万+: 粉丝

10万+: 获赞

382: 评论

11万+: 收藏

私信

关注

热门文章

分类专栏

最新评论

PySpark 大数据分析实用指南（一）
拔刀能留住落樱吗Q: 图片都失效了
安卓逆向系列教程 4.4 逆向云播 VIP
2201_75534666: 下载不了
ChatGPT 网络安全秘籍（四）
qzl2812361840: 我相信没有几个看完的
Linux 内核编程（六）
xgbnki: /home/book/tronlong_3568/RK3568/rk356x_linux_release_v1.3.1_20221120/Quectel_GobiNet_V1.3.0/src/QMIDevice.c: In function 'DeregisterQMIDevice': ./arch/arm64/include/asm/atomic.h:45:39: error: 'refcount_t' {aka 'struct refcount_struct'} has no member named 'counter' 45 | #define atomic_read(v) READ_ONCE((v)->counter) | ^~ ./include/linux/compiler.h:325:17: note: in definition of macro '__READ_ONCE' 325 | union { typeof(x) __val; char __c[1]; } __u; \ | ^ ./arch/arm64/include/asm/atomic.h:45:26: note: in expansion of macro 'READ_ONCE' 45 | #define atomic_read(v) READ_ONCE((v)->counter) | ^~~~~~~~~ /home/book/tronlong_3568/RK3568/rk356x_linux_release_v1.3.1_20221120/Quectel_GobiNet_V1.3.0/src/QMIDevice.c:3389:17: note: in expansion of macro 'atomic_read' 3389 | int ref = atomic_read( &pDev->mQMIDev.mCdev.kobj.kref.refcount ); 在编译4g模块ec20驱动出现问题，怀疑就是新老内核接口变化
Transformers 源码解析（五十五）
...天晴...: 您好在启动程序遇到一个问题，追溯到这个tokenization_clip.py 36-43代码上的映射，一直提示我File "D:\software\stable-diffusion-webui-master\venv\lib\site-packages\transformers\models\clip\tokenization_clip.py", line 324, in __init__ with open(vocab_file, encoding="utf-8") as vocab_handle: TypeError: expected str, bytes or os.PathLike object, not NoneType 我后面改了映射地址"openai/clip-vit-large-patch32": "https://hf-mirror.com/openai/clip-vit-base-patch32/resolve/main/vocab.json" 同时我还保证我openai/clip-vit-large-patch32在根目录，但是报错依旧存在，不知道大哥是否可以解惑一下我是想试着在自己win11下部署一个，无奈遇到贼多问题，卡死在启动上了

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。