Pytorch学习（六） --- 模型训练的常规train函数flow及其配置

最新推荐文章于 2024-11-12 22:39:35 发布

梦坠凡尘(AICV与前沿)

最新推荐文章于 2024-11-12 22:39:35 发布

阅读量1.5w

点赞数 23

分类专栏： Pytorch 文章标签： Pytorch

本文链接：https://blog.csdn.net/c2250645962/article/details/105294851

版权

Pytorch 专栏收录该内容

16 篇文章

订阅专栏

本文详细介绍使用Pytorch进行图像分类任务的训练流程，包括数据加载、模型定义、损失函数设置及优化器选择等关键步骤，并提供了一个从数据准备到模型训练、保存的完整pipeline示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前几个Pytorch学习博客写了使用Pytorch的数据读取、数据增强、数据加载、模型定义，当完成上面几个步骤，就可以进行模型训练了。

使用Pytorch进行模型训练，通常可以将train过程写成一个函数，简单的train写法常规的传入参数如下：

数据加载器DataLoader
目标模型model
损失函数criterion
优化器optimizer

较为简单的train函数可以写为如下：

def train(DataLoader, model, criterion, optimizer):
	model.cuda()
	# 指定为train模式
	model.train()

	for i, (img, target) in tqdm(enumerate(DataLoader)):
		img = img.cuda()
		target = target.cuda()
		# 计算网络输出
		output = model(img)
		
		# 计算损失
		loss = criterion(output, target)
		
		
		# 计算梯度和做反向传播
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

那么，一个较为完整的使用Pytorch训练分类任务pipeline可以简单的表示如下：

1. 定义数据加载
Dataset = torchvision.Dataset(root, transform)

2. 定义模型
model = torchvision.models.xxxx(num_class)

3. 定义数据加载器
DataLoader = torch.util.data.DataLoader(Dataset, batch_size, num_workers)

4. 模型训练

# 定义优化器
optimizer = 
# 定义损失函数
criterion = 
# 定义学习率调整
scheduler = 
for i in range(epoch_number):
	# 根据epoch调整学习率
	scheduler.step()
	# 调用训练函数
	train(train_loader, model, criterion, optimizer)

	# 模型保存
	torch.save(model.state_dict(), path)