-
初始化模型:创建模型实例,并初始化模型参数。
-
定义损失函数:选择一个损失函数来衡量模型预测与实际值之间的差异。
-
选择优化器:选择一个优化算法(如SGD, Adam等)来更新模型参数。
-
数据加载:加载训练数据,并进行预处理。
-
训练循环:迭代训练数据,执行以下操作:
- 前向传播:计算模型的输出。
- 计算损失:使用损失函数计算预测输出和真实标签之间的差异。
- 反向传播:根据损失计算梯度。
- 参数更新:使用优化器更新模型参数。
-
评估:在验证集或测试集上评估模型性能。
-
保存模型:保存训练好的模型以供后续使用。
下面是一个简单的Python示例,展示了一个基本的训练函数的框架:
import torch
from torch import nn, optim
# 假设我们有一个简单的模型
class SimpleModel(nn.Module):
def __init__(self):
super(SimpleModel, self).__init__()
self.linear = nn.Linear(in_features=10, out_features=1)
def forward(self, x):
return self.linear(x)
# 训练函数
def train(model, train_loader, criterion, optimizer, num_epochs):
model.train() # 设置模型为训练模式
for epoch in range(num_epochs):
for batch_idx, (data, target) in enumerate(train_loader):
optimizer.zero_grad() # 清除之前的梯度
output = model(data) # 前向传播
loss = criterion(output, target) # 计算损失
loss.backward() # 反向传播
optimizer.step() # 更新参数
if batch_idx % 10 == 0:
print(f'Epoch [{epoch+1}/{num_epochs}], Step [{batch_idx}/{len(train_loader)}], Loss: {loss.item()}')
# 初始化模型、损失函数、优化器
model = SimpleModel()
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)
# 假设train_loader已经准备好,包含了数据和标签
# train_loader = ...
# 调用训练函数
train(model, train_loader, criterion, optimizer, num_epochs=10)