PyTorch实例3——迁移学习

利用迁移学习提升图像分类效果：ResNet18在PyTorch中的应用

最新推荐文章于 2024-03-23 15:23:51 发布

_23_

最新推荐文章于 2024-03-23 15:23:51 发布

阅读量1.9k

点赞数 6

CC 4.0 BY-SA版权

分类专栏：毕设学习笔记深度学习文章标签： pytorch 迁移学习 python

本文链接：https://blog.csdn.net/a23_23/article/details/128689188

本文详细介绍了如何在PyTorch中使用迁移学习，特别是ResNet18模型，来提高小数据集上的图像分类性能。实验通过加载预训练的ResNet模型，然后替换最后的全连接层以适应特定的分类任务。实验对比了预训练模式和固定值模式下的训练效果，发现预训练模式能显著降低错误率，显示出迁移学习的优势。

传送门：蓝桥云课实验

1. 实验环境

Jupyter Notebook
Python 3.7
PyTorch 1.4.0

2. 实验目的

迁移学习，让机器拥有能够“举一反三”的能力。
本次实验就以“是蚂蚁还是蜜蜂”为例，探索如何将已训练好的大网络迁移到小数据集上，并经过少量数据集的训练就让它获得非常出众的效果。

3. 相关原理

使用 PyTorch 的数据集套件从本地加载数据的方法
迁移训练好的大型神经网络模型到自己模型中的方法
迁移学习与普通深度学习方法的效果区别
两种迁移学习方法的区别

4. 实验步骤

# 下载实验所需数据并解压
!wget http://labfile.oss.aliyuncs.com/courses/1073/transfer-data.zip
!unzip transfer-data.zip

4.1 数据收集

实验中的数据是已经准备好的，训练数据集在 ./data/train 中，校验数据集在 ./data/val 中。（推荐直接到蓝桥云课上进行实验）。如果使用自己的环境只需要自己准备相关图片数据，并将代码中的路径改成你自己的数据集路径。

#引入实验所需要的包
import torch
import torch.nn as nn
import torch.optim as optim
from torch.autograd import Variable
import torch.nn.functional as F
import numpy as np
import torchvision
from torchvision import datasets, models, transforms
import matplotlib.pyplot as plt
import time
import copy
import os

4.1.1加载数据

使用 datasets 的 ImageFolder 方法就可以实现自动加载数据，因为数据集中的数据可能分别在不同的文件夹中，要让所有的数据一起加载。

# 数据存储总路径
data_dir = 'transfer-data'
# 图像的大小为224*224
image_size = 224
# 从data_dir/train加载文件
# 加载的过程将会对图像自动作如下的图像增强操作：
# 1. 随机从原始图像中切下来一块224*224大小的区域
# 2. 随机水平翻转图像
# 3. 将图像的色彩数值标准化
train_dataset = datasets.ImageFolder(os.path.join(data_dir, 'train'),
                                    transforms.Compose([
                                        transforms.RandomResizedCrop(image_size),
                                        transforms.RandomHorizontalFlip(),
                                        transforms.ToTensor(),
                                        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
                                    ])
                                    )

# 加载校验数据集，对每个加载的数据进行如下处理：
# 1. 放大到256*256像素
# 2. 从中心区域切割下224*224大小的图像区域
# 3. 将图像的色彩数值标准化
val_dataset = datasets.ImageFolder(os.path.join(data_dir, 'val'),
                                    transforms.Compose([
                                        transforms.Resize(256),
                                        transforms.CenterCrop(image_size),
                                        transforms.ToTensor(),
                                        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
                                    ])
                                    )

下面要为每个数据集创建数据加载器。

# 创建相应的数据加载器
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size = 4, shuffle = True, num_workers=4)
val_loader = torch.utils.data.DataLoader(val_dataset, batch_size = 4, shuffle = True, num_workers=4)

# 读取得出数据中的分类类别数
# 如果只有蜜蜂和蚂蚁，那么是2
num_classes = len(train_dataset.classes)
num_classes

输出：2

4.1.2 GPU运算

第一次了解GPU运算是在第一篇博客PyTorch，简单的了解了一下。

深度学习可以通过 GPU 并行运算加速模型的训练。
PyTorch 是支持使用 GPU 并行运算的。但是能不能使用 GPU 加速运算还取决于硬件，支持 GPU 的硬件（显卡）一般是比较昂贵的。
如果你想让自己的程序能够自动识别 GPU 计算环境，并且在 GPU 不具备的情况下也能自动使用 CPU 正常运行，可以这么做：
这三个变量，之后会用来灵活判断是否需要采用 GPU 运算。

# 检测本机器是否安装GPU，将检测结果记录在布尔变量use_cuda中
use_cuda = torch.cuda.is_available()

# 当可用GPU的时候，将新建立的张量自动加载到GPU中
dtype = torch.cuda.FloatTensor if use_cuda else torch.FloatTensor
itype = torch.cuda.LongTensor if use_cuda else torch.LongTensor

4.2 数据预处理

该函数作用：将数据集中的某张图片打印出来。

def imshow(inp, title=None):
    # 将一张图打印显示出来，inp为一个张量，title为显示在图像上的文字

    # 一般的张量格式为：channels * image_width * image_height
    # 而一般的图像为 image_width * image_height * channels 
    # 所以，需要将张量中的 channels 转换到最后一个维度
    inp = inp.numpy().transpose((1, 2, 0)) 

    #由于在读入图像的时候所有图像的色彩都标准化了，因此我们需要先调回去
    mean = np