整体流程:
- 准备数据集
- 使用Class构造模型(目的是计算y_hat)
- 构造loss和优化器
- 设置训练周期(一个训练周期=forward+backward+update);forward目的是计算loss,backward目的是计算梯度grad,update的目的是更新权重w
概念:PyTorch的Affine Model(仿射模型)在PyTorch中也叫linear unit(线性单元)
使用PyTorch构造模型的步骤 :
- 把模型定义成一个类,且继承自父类nn.Module(因为Module中有很多有用的方法)
- 定义的类中最少需要实现两个函数:__init__()和forward():__init__()中的super必须要有;在nn.Module中已经定义了__call__(),因此实例可以直接被调用。
- 构造损失函数和优化器:
- 训练周期:forward(截至到求loss)+backward(loss.backward)+update(step函数)
总结:实现线性回归的四步:
课上代码实现:
import torch
import torch.nn as nn
import torch.optim as optim
import matplotlib.pyplot as plt
x_data = torch.tensor([[1.0], [2.0], [3.0]])
y_data = torch.tensor([[2.0], [4.0], [6.0]])
class LinearModel(nn.Module):
def __init__(self):
super(LinearModel, self).__init__()
self.linear = nn.Linear(1, 1)
def forward(self, x):
y_pred = self.linear(x)
return y_pred
model = LinearModel()
criterion = nn.MSELoss(size_average=False)
optimizer = optim.SGD(model.parameters(), lr= 0.01)
epoch_list = []
loss_list = []
for epoch in range(100):
y_pred = model(x_data)
loss = criterion(y_pred, y_data)
print(epoch, loss)
epoch_list.append(epoch)
loss_list.append(loss.item())
optimizer.zero_grad()
loss.backward()
optimizer.step()
print('w= ', model.linear.weight.item())
print('b= ', model.linear.bias.item())
x_test = torch.tensor([4.0])
y_test = model(x_test)
print('y_pred = ', y_test.item()) # 如果是y_pred.data又会是什么样呢?
# 绘制loss曲线
plt.plot(epoch_list, loss_list)
plt.xlabel("Epoch")
plt.ylabel("Loss")
plt.show()