神经网络 varible变量

最新推荐文章于 2022-05-13 10:31:52 发布

晓雯耶

最新推荐文章于 2022-05-13 10:31:52 发布

阅读量685

点赞数

文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_43906864/article/details/107390095

版权

variable变量，提供了自动求导的功能，和Tensor本质没有区别，不过variable会被放入一个计算图中，然后进行前向传播、反向传播、自动求导。

将一个tensor变成variable，只需要variable(a)即可。
结构图包括data、grad、grad_fn。通过data可以取出variable里面的tensor数值，grad_fn表示得到这个variable的操作，比如通过加减还是乘除来得到的，最后gard是这个variable的反向传播梯度。
例如


```python
#create variable
x=Variable(torch.Tensor([1]),requires_grad=True)
w=Variable(torch.Tensor([1]),requires_grad=True)
b=Variable(torch.Tensor([1]),requires_grad=True)
#build a computation graph  y=2*x+3
y=w*x+b
#compute gradients
y.backward()
#print out the gradients
print(x.grad)#2
print(w.grad)#1
print(b.grad)#1

上面是对标量的求导，同时也可以对矩阵求导比如

x=torch.randn(3)
x=Variable(x,require_grad=True)
y=x*2
print(y)
y.backward(torch.FloatTensor([1,0.1,0.01]))
print(x.grad)#2 0.2 0.02

相当于给出了三维向量去做运算，得到的结果y就是一个向量,这里对这个向量的求导就不能直接写成y.backward()，这样程序会报错的。这个时候需要传入参数声明，比如y.backward(torch.FloatTensor([1,1,1])),这样得到的结果是它们每个分量的梯度，或者可以传入y.backward（torch.FloatTensor([1,0.1,0.01])),这样得到的梯度就是他们原本的梯度分别乘上1，0.1，0.01。