Pytorch学习笔记（四）

最新推荐文章于 2024-06-02 18:21:33 发布

Hygge0+

最新推荐文章于 2024-06-02 18:21:33 发布

阅读量1.3k

点赞数 1

分类专栏：深度学习文章标签： pytorch 学习深度学习

本文链接：https://blog.csdn.net/weixin_56744177/article/details/128185399

版权

深度学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

模型训练

本笔记包含对现有网络模型的使用和修改、保存与读取、完整的模型训练套路、利用GPU训练的两种方法以及完整的模型验证套路。

model_pretrained.py:现有网络模型的使用和修改，以pytorch官网中用于分类的vgg16模型为例，其是在ImageNet数据集（1000个class）上进行预训练。但实操中由于ImageNet数据集过大，有100G，故而未下载到本地。只是利用加载模型参数的不同在debug中观察vgg16在数据集上训练前后参数的不同。同时以将vgg16模型应用到CIFAR-10数据集（10个class）上为例实现模型修改。

model_save.py model_load.py：包含两种模型保存方法以及两种相应的模型加载方法。模型保存包括保存模型结构和模型训练数据及参数。model.py:为了规范化网络训练步骤，将搭建模型部分单独存放在文件中，在训练模型时将其引入即可。train_cpu.py：在cpu上实现完整的模型训练

train_gpu1.py：利用.cuda（）方法在gpu上实现完整的模型训练train_gpu2.py：利用.to(device)在gpu上实现完整的模型训练

test.py：在文件中load已训练且保存好的模型，在imgs中随意添加CIFAR-10数据集中所包含的图像类别相关图片，进行测试验证。如：dog.pn/airplane.png

实验证明利用model_0.pth（即训练一轮保存的模型）会将图片分类错误，使用model_10.pth（即训练十轮保存的模型）会将图片正确分类。

CIFAR-10 数字对应类别
#‘airplane’=0 'automobile'=1 'bird'=2 'cat'=3 'deer'=4
# 'dog'=5 'frog'=6 'horse'=7 'ship'=8 'truck'=9 _len_=10

model_pretrained.py

import torchvision
from torch import nn

# train_data=torchvision.datasets.ImageNet("../dataset",split='train',download=True,
#                                          transform=torchvision.transforms.ToTensor())
# #RuntimeError: The archive ILSVRC2012_devkit_t12.tar.gz is not present in the root directory or is corrupted.
# # You need to download it externally and place it in ../dataset. 只能手动下载 但文件但大了100G

#由于数据集太大 接下来只能debug观察一下模型pretrained=false和true时的区别
#false时 是初始的weight true时，是在ImageNet数据集上训练好的参数
vgg16_false=torchvision.models.vgg16(pretrained=False)#flase时只是加载网络模型，不需要下载
vgg16_true=torchvision.models.vgg16(pretrained=True)#true时需要下载网络模型
# print("ok") #打断点 debug
print(vgg16_true) #输出网络模型 可以知道vgg16可以识别1000个类别（ImageNet数据集含1000个class）

#之前用的CIFAR10数据集包含10个class
train_data=torchvision.datasets.CIFAR10("../dataset",train=True,download=True,
                                         transform=torchvision.transforms.ToTensor())

# 如何在CIFAR10上应用这样一个输出类别为1000个的模型呢？
# 方式①将最后一层线性层中的out_feature的1000 改为10
# 方式②在分类器中再加一层线性层 in_features=1000,out_features=10

#在vgg16_true模型结构中添加层
vgg16_true.classifier.add_module('add_linear',nn.Linear(1000,10))
print(vgg16_true)

print(vgg16_false)
#修改vgg16_false模型结构
vgg16_false.classifier[6]=nn.Linear(4096,10)
print(vgg16_false)

vgg16model 结构：（未截图完整）

原vgg16model中的classifier：（最后一个线性层可以看出class为1000个）

add_module后的classifier：

修改最后classifier中最后一个线性层后：