总体分为四个步骤:准备数据集、设计模型(通过前馈和反馈函数计算y^,直接从nn.module中继承)、构造损失函数和优化器(使用PyTorch应用接口)、训练周期(一个周期包含前馈、反馈、更新)
执行代码如下:
import torch
x_data = torch.Tensor([[1.0], [2.0], [3.0]]) # x_data为3*1的矩阵
y_data = torch.Tensor([[2.0], [4.0], [6.0]])
# 使用mini-batch封装数据,x和y的值必须是矩阵
class LinearModel(torch.nn.Module): # 把模型定义为一个类,继承自module
def __init__(self): # 构造函数:初始化对象时默认调用的函数
super(LinearModel, self).__init__() # 必须要有的第一步
self.linear = torch.nn.Linear(1, 1) # 构造对象,包含权重w和偏置b,linear继承自module,故也能自动进行反向传播
def forward(self, x): # 前馈过程中执行的计算,不需要backward,会自动实现
y_pred = self.linear(x)
return y_pred
model = LinearModel() # 实例化类LinearModel
criterion = torch.nn.MSELoss(reduction='sum') # 损失函数,MSELoss继承自nn.Module,此处不求均值,需要的参数是y^和y
# 原处使用的是size_average='False',然后运行有警告,故修改为reduction='sum'
optimizer = torch.optim.SGD(model.parameters(), lr=0.01) # 优化器,来自优化模块中的SGD类,参数包括权重和偏置,lr是学习率
# 训练过程
for epoch in range(100):
y_pred = model(x_data)
loss = criterion(y_pred, y_data)
print(epoch, loss.item()) # loss不是一个值,是一个对象
optimizer.zero_grad() # 所有权重的梯度归零
loss.backward() # 反向传播
optimizer.step() # 进行一次更新
# 打印权重和偏置的值
print('w =', model.linear.weight.item())
print('b =', model.linear.bias.item())
# 使用训练好的模型预测
x_test = torch.Tensor([[4.0]])
y_test = model(x_test)
print('y_pred =', y_test.item())