pytorch使用（五）使用pytorch进行微调（fine-tuning）

最新推荐文章于 2024-06-11 20:46:12 发布

贪泉觉爽

最新推荐文章于 2024-06-11 20:46:12 发布

阅读量1.1w

点赞数 2

分类专栏： pytorch 深度学习文章标签： pytorch

本文链接：https://blog.csdn.net/GYGuo95/article/details/79945631

版权

深度学习同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

pytorch

7 篇文章 1 订阅

订阅专栏

pytorch使用：目录

pytorch使用（五）使用pytorch进行微调（fine-tuning）

在使用pytorch的时候，发现使用预训练的模型进行微调的时候有比较难的两步，一是如何加载需要的两部分模型

1. 定义网络并且加载网络参数

首先定义自己模型并且加载预训练网络的模型和参数，定义自己模型的时候把想要用的层名字设置为和预训练模型一样的
加载预训练模型中的参数到自己的模型

# load the pre-trained network
model_zero = C3D()
model_zero.load_state_dict(torch.load(paraPath))

model = ROI_C3D(classes=para['nClass'])#ROI_C3D is my net
model_dict = model.state_dict()

model_zero = {k: v for k, v in model_zero.state_dict().items() if k in model_dict}
model_dict.update(model_zero)
model.load_state_dict(model_dict)

2. 设置学习率

通常预训练层的学习率会低一些. 在下面这个例子中，在定义网络的时候，相比原来的模型，将最后一个全连接的名字改为了classifier

#set optimization method
ignored_params = list(map(id, model.classifier.parameters())) #layer need to be trained
base_params = filter(lambda p: id(p) not in ignored_params,model.parameters())
optimizer = optim.SGD([
    {'params': base_params},
    {'params': model.classifier.parameters(), 'lr': para['lr']*0.1}], 0.001, momentum=0.9, weight_decay=1e-4)

这样预训练的模型学习率是0.0001，而最后一个全连接是0.001

贪泉觉爽

关注

2
点赞
踩
25

收藏

觉得还不错? 一键收藏
1
评论
pytorch使用（五）使用pytorch进行微调（fine-tuning）

pytorch使用：目录pytorch使用（五）使用pytorch进行微调（fine-tuning）在使用pytorch的时候，发现使用预训练的模型进行微调的时候有比较难的两步，一是如何加载需要的两部分模型1. 定义网络并且加载网络参数首先定义自己模型并且加载预训练网络的模型和参数，定义自己模型的时候把想要用的层名字设置为和预训练模型一样的加载预训练模型中的参数到自...
复制链接

扫一扫