pytorch中自定义参数基于auto_grad的随机下降法梯度更新的几种方式

最新推荐文章于 2024-07-01 08:59:49 发布

OhMy棒棒糖yqy

最新推荐文章于 2024-07-01 08:59:49 发布

阅读量560

点赞数 1

文章标签： pytorch 深度学习 python

本文链接：https://blog.csdn.net/qq_58153224/article/details/127645071

版权

首先说一种踩过的坑

import torch

X=torch.Tensor([1,2,3])
X.requires_grad=True
print(X)
y=torch.sum(X**2*2)
y.backward()
'''模拟参数更新'''
lr=0.1
X=torch.Tensor(X-X.grad.data*lr)
print(X)
print(X.grad.data)

这是不能实现的

如果你曾经见过这种报错，那么恭喜你，你和我踩了一样的坑。

问题出在参数更新部分，也就是说X也需要.data才能正常赋值，改成这样就可以了

import torch

X=torch.Tensor([1,2,3])
X.requires_grad=True
print(X)
y=torch.sum(X**2*2)
y.backward()
'''模拟参数更新'''
lr=0.1
X.data=X.data-X.grad.data*lr
print(X)
print(X.grad.data)
X.grad.data.zero_()
print(X.grad.data)
'''第二次参数更新'''
y=torch.sum(X**2*2)
y.backward()
print(X.grad.data)

上面是最常见的更新方式

还有一种自创的，

import torch

X=torch.Tensor([1,2,3])
X.requires_grad=True
print(X)
y=torch.sum(X**2*2)
y.backward()
'''模拟参数更新'''
lr=0.1
d_x=X.grad.data
print(d_x)
X1=X.detach()-d_x*lr
X=torch.Tensor(X1)
X.requires_grad=True
print(X)
#第二次反向传播
y=torch.sum(X**2*2)
y.backward()
print(X.grad.data)