- 设置该参数为可微分 ,后续保持跟踪
.requries_grad(ture)
- 输入特征与模型进行前向计算
- 调用.backward() 计算梯度
此时梯度保存在.grad属性中
第一步:生成数据
#%%
x_values = [i for i in range(11)]
x_train = np.array(x_values, dtype=np.float32)
x_train = x_train.reshape(-1, 1)
x_train.shape
#%%
y_values = [2*i + 1 for i in x_values]
y_train = np.array(y_values, dtype=np.float32)
y_train = y_train.reshape(-1, 1)
y_train.shape
第二步: 导入模块,构建模型
#%%
import torch
import torch.nn as nn
#%% md
### 线性回归模型
- 其实线性回归就是一个不加激活函数的全连接层
#%%
class LinearRegressionModel(nn.Module):
def __init__(self, input_dim, output_dim):
super(LinearRegressionModel, self).__init__()
self.linear = nn.Linear(input_dim, output_dim)
def forward(self, x):
out = self.linear(x)
return out
第三步:模型超参数设置
#%%
input_dim = 1
output_dim = 1
model = LinearRegressionModel(input_dim, output_dim)
epochs = 1000
learning_rate = 0.01
optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)
criterion = nn.MSELoss()
分类任务: 交叉熵损失
回归任务: MSE 均方差损失
第四步:训练模型
for epoch in range(epochs):
epoch += 1
# 注意转行成tensor
inputs = torch.from_numpy(x_train)
labels = torch.from_numpy(y_train)
# 梯度要清零每一次迭代
optimizer.zero_grad()
# 前向传播
outputs = model(inputs)
# 计算损失
loss = criterion(outputs, labels)
# 返向传播
loss.backward()
# 更新权重参数
optimizer.step()
if epoch % 50 == 0:
print('epoch {}, loss {}'.format(epoch, loss.item()))
第五步: 计算预测结果
predicted = model(torch.from_numpy(x_train).requires_grad_()).data.numpy()
predicted
第六步:保存模型
#%%
torch.save(model.state_dict(), 'model.pkl')
#%%
model.load_state_dict(torch.load('model.pkl'))
补充:使用GPU训练模型
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model.to(device)