variable变量,提供了自动求导的功能,和Tensor本质没有区别,不过variable会被放入一个计算图中,然后进行前向传播、反向传播、自动求导。
将一个tensor变成variable,只需要variable(a)即可。
结构图包括data、grad、grad_fn。通过data可以取出variable里面的tensor数值,grad_fn表示得到这个variable的操作,比如通过加减还是乘除来得到的,最后gard是这个variable的反向传播梯度。
例如
```python
#create variable
x=Variable(torch.Tensor([1]),requires_grad=True)
w=Variable(torch.Tensor([1]),requires_grad=True)
b=Variable(torch.Tensor([1]),requires_grad=True)
#build a computation graph y=2*x+3
y=w*x+b
#compute gradients
y.backward()
#print out the gradients
print(x.grad)#2
print(w.grad)#1
print(b.grad)#1
上面是对标量的求导,同时也可以对矩阵求导比如
x=torch.randn(3)
x=Variable(x,require_grad=True)
y=x*2
print(y)
y.backward(torch.FloatTensor([1,0.1,0.01]))
print(x.grad)#2 0.2 0.02
相当于给出了三维向量去做运算,得到的结果y就是一个向量,这里对这个向量的求导就不能直接写成y.backward(),这样程序会报错的。这个时候需要传入参数声明,比如y.backward(torch.FloatTensor([1,1,1])),这样得到的结果是它们每个分量的梯度,或者可以传入y.backward(torch.FloatTensor([1,0.1,0.01])),这样得到的梯度就是他们原本的梯度分别乘上1,0.1,0.01。