finetune代码实战讲解（李沐）

最新推荐文章于 2024-07-31 08:44:03 发布

马鹏森

最新推荐文章于 2024-07-31 08:44:03 发布

阅读量8k

点赞数 2

分类专栏： # finetune 文章标签：深度学习神经网络 pytorch

本文链接：https://blog.csdn.net/weixin_43135178/article/details/122319048

版权

finetune 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本文介绍了如何使用ResNet-18模型进行热狗与非热狗图像的识别任务。通过预训练模型的微调，提高了模型在二分类任务上的性能。微调过程中，对预训练模型的最后一层进行了初始化并调整为适合二分类任务，同时使用不同的学习率策略分别优化预训练部分和新添加层的参数。对比未进行微调的模型，微调后的模型在识别精度上有显著提升，验证了迁移学习的有效性。

摘要由CSDN通过智能技术生成

这里要做的是热狗识别：即识别出是否是热狗，我们给了两个类别（正类：热狗，负类：香蕉）

../_images/output_fine-tuning_368659_33_0.png

备注：resnet18是 imagenet 数据集的预训练模型

finetune的全过程：

import os
import torch
import torchvision
from torch import nn
from d2l import torch as d2l



# 解压下载的数据集，我们获得了两个文件夹hotdog/train和hotdog/test。 这两个文件夹都有hotdog（有热狗）和not-hotdog（无热狗）两个子文件夹， 子文件夹内都包含相应类的图像。

# d2l.DATA_HUB['hotdog'] = (d2l.DATA_URL + 'hotdog.zip', 'fba480ffa8aa7e0febbb511d181409f899b9baa5')
# data_dir = d2l.download_extract('hotdog')

data_dir = './hotdog'

# 我们创建两个实例来分别读取训练和测试数据集中的所有图像文件。
train_imgs = torchvision.datasets.ImageFolder(os.path.join(data_dir, 'train'))
test_imgs = torchvision.datasets.ImageFolder(os.path.join(data_dir, 'test'))

# 下面显示了前8个正类样本图片和最后8张负类样本图片。 正如你所看到的，[图像的大小和纵横比各有不同]。
hotdogs = [train_imgs[i][0] for i in range(8)]
not_hotdogs = [train_imgs[-i - 1][0] for i in range(8)]
d2l.show_images(hotdogs + not_hotdogs, 2, 8, scale=1.4)
d2l.plt.show()

# 在训练期间，我们首先从图像中裁切随机大小和随机长宽比的区域，然后将该区域缩放为 224×224 输入图像。
# 在测试过程中，我们将图像的高度和宽度都缩放到256像素，然后裁剪中央 224×224 区域作为输入。 此外，对于RGB（红、绿和蓝）颜色通道，我们分别标准化每个通道。
# 具体而言，该通道的每个值减去该通道的平均值，然后将结果除以该通道的标准差。
# 使用RGB通道的均值和标准差，以标准化每个通道
normalize = torchvision.transforms.Normalize(
    [0.485, 0.456, 0.406], [0.229, 0.224, 0.225])

train_augs = torchvision.transforms.Compose([
    torchvision.transforms.RandomResizedCrop(224),
    torchvision.transforms.RandomHorizontalFlip(),
    torchvision.transforms.ToTensor(),
    normalize])

test_augs = torchvision.transforms.Compose([
    torchvision.transforms.Resize(256),
    torchvision.transforms.CenterCrop(224),
    torchvision.transforms.ToTensor(),
    normalize])

# [定义和初始化模型] 我们使用在ImageNet数据集上预训练的ResNet-18作为源模型。 在这里，我们指定pretrained=True以自动下载预训练的模型参数。
pretrained_net = torchvision.models.resnet18(pretrained=True)

# [定义需要finetune的模型]
finetune_net = torchvision.models.resnet18(pretrained=True)
# 因为我们要做的是一个二分类问题，所以只需要改变最后一层的输出分类为2，然后只初始化最后一层的weight
finetune_net.fc = nn.Linear(finetune_net.fc.in_features, 2)
nn.init.xavier_uniform_(finetune_net.fc.weight)


# [微调模型]
# 首先，我们定义了一个训练函数train_fine_tuning，该函数使用微调，因此可以多次调用
# 如果param_group=True，输出层中的模型参数将使用十倍的学习率
def train_fine_tuning(net, learning_rate, batch_size=128, num_epochs=5, param_group=True):
    train_iter = torch.utils.data.DataLoader(torchvision.datasets.ImageFolder(os.path.join(data_dir, 'train'), transform=train_augs), batch_size=batch_size, shuffle=True)
    test_iter  = torch.utils.data.DataLoader(torchvision.datasets.ImageFolder(os.path.join(data_dir, 'test'), transform=test_augs), batch_size=batch_size)
    devices = d2l.try_all_gpus()
    loss = nn.CrossEntropyLoss(reduction="none")
    if param_group:
        # 取出除了最后一层(fc)之外的全部层的参数：params_1x
        params_1x = [param for name, param in net.named_parameters() if name not in ["fc.weight", "fc.bias"]]
        # params_1x使用正常的学习率，但是fc的学习率为正常学习率的十倍
        trainer = torch.optim.SGD([{'params': params_1x},
                                   {'params': net.fc.parameters(),
                                    'lr': learning_rate * 10}],
                                     lr=learning_rate, weight_decay=0.001)
    else:
        trainer = torch.optim.SGD(net.parameters(), lr=learning_rate, weight_decay=0.001)
    # 画出
    d2l.train_ch13(net, train_iter, test_iter, loss, trainer, num_epochs, devices)
    d2l.plt.show()


# 我们[使用较小的学习率]，通过微调预训练获得的模型参数。
train_fine_tuning(finetune_net, 5e-5)

没有进行finetune的结果：

# [为了进行比较，]我们定义了一个相同的模型，但是将其(所有模型参数初始化为随机值)。由于整个模型需要从头开始训练，因此我们需要使用更大的学习率。


scratch_net = torchvision.models.resnet18()
scratch_net.fc = nn.Linear(scratch_net.fc.in_features, 2)
train_fine_tuning(scratch_net, 5e-4, param_group=False)

结果：

可以看到，有finetune和没有finetune的结果总共差了10个百分点

小结

迁移学习将从源数据集中学到的知识“迁移”到目标数据集，微调是迁移学习的常见技巧。
除输出层外，目标模型从源模型中复制所有模型设计及其参数，并根据目标数据集对这些参数进行微调。但是，目标模型的输出层需要从头开始训练。
通常，微调参数使用较小的学习率，而从头开始训练输出层可以使用更大的学习率。

事实上，ImageNet数据集中有一个“热狗”类别。我们需要我们可以通过以下代码获取其输出层中的相应权重参数，但是我们怎样才能利用这个权重参数？

weight = pretrained_net.fc.weight
hotdog_w = torch.split(weight.data, 1, dim=0)[713]
hotdog_w.shape

13.2. 微调 — 动手学深度学习 2.0.0-beta0 documentation

马鹏森

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
打赏
0
评论
finetune代码实战讲解（李沐）

这里要做的是热狗识别：即识别出是否是热狗，我们给了两个类别（正类：热狗，负类：香蕉）备注：resnet18是imagenet 数据集的预训练模型finetune的全过程：import osimport torchimport torchvisionfrom torch import nnfrom d2l import torch as d2l# 解压下载的数据集，我们获得了两个文件夹hotdog/train和hotdog/test。这两个文件夹都有hotdog（...
复制链接

扫一扫