pytorch中的Variable()解析

最新推荐文章于 2024-02-27 09:00:00 发布

LS_learner

最新推荐文章于 2024-02-27 09:00:00 发布

阅读量3.7k

点赞数 4

分类专栏： pytorch

本文链接：https://blog.csdn.net/qq_39777550/article/details/108176120

版权

pytorch 专栏收录该内容

6 篇文章 1 订阅

订阅专栏

pytorch中的Variable()解析

Variable就是变量的意思。实质上也就是可以变化的量，区别于int变量，它是一种可以变化的变量，这正好就符合了反向传播，参数更新的属性。
pytorch都是由tensor计算的，而tensor里面的参数都是Variable的形式。如果用Variable计算的话，那返回的也是一个同类型的Variable。
举例说明：

import torch
from torch.autograd import Variable # torch 中 Variable 模块
tensor = torch.FloatTensor([[1,2],[3,4]])
# requires_grad是参不参与误差反向传播, 要不要计算梯度
variable = Variable(tensor, requires_grad=True)
print(tensor)
"""
 1 2
 3 4
[torch.FloatTensor of size 2x2]
"""
print(variable)
"""
Variable containing:
 1 2
 3 4
[torch.FloatTensor of size 2x2]
"""

注：tensor不能反向传播，variable可以反向传播。
Variable计算时，它会逐渐地生成计算图。这个图就是将所有的计算节点都连接起来，最后进行误差反向传递的时候，一次性将所有Variable里面的梯度都计算出来，而tensor就没有这个能力。
Variable()中的参数：
1、requires_grad （指定该节点及依赖它的节点是否求导）
variable默认是不需要被求导的，即requires_grad属性默认为False，如果某一个节点的requires_grad为True，那么所有依赖它的节点requires_grad都为True。
2、volatile （指定该节点及依赖它的节点是否不求导）
variable的volatile属性默认为False，如果某一个variable的volatile属性被设为True，那么所有依赖它的节点volatile属性都为True。volatile属性为True的节点不会求导，volatile的优先级比requires_grad高。
3、retain_graph
多次反向传播（多层监督）时，梯度是累加的。一般来说，单次反向传播后，计算图会free掉，也就是反向传播的中间缓存会被清空【这就是动态度的特点】。为进行多次反向传播需指定retain_graph=True来保存这些缓存。
4、backward()
反向传播，求解Variable的梯度。放在中间缓存中。

LS_learner

关注

4
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
pytorch中的Variable()解析

pytorch中的Variable()解析Variable就是变量的意思。实质上也就是可以变化的量，区别于int变量，它是一种可以变化的变量，这正好就符合了反向传播，参数更新的属性。具体来说，在pytorch中的Variable就是一个存放会变化值的地理位置，里面的值会不停发生变化，就像一个装鸡蛋的篮子，鸡蛋数会不断发生变化。那谁是里面的鸡蛋呢，自然就是pytorch中的tensor了。（也就是说，pytorch都是由tensor计算的，而tensor里面的参数都是Variable的形式）。如果用Var
复制链接

扫一扫

专栏目录