Pytorch采用不同的学习率训练网络

最新推荐文章于 2023-05-30 16:59:49 发布

guls999

最新推荐文章于 2023-05-30 16:59:49 发布

阅读量795

点赞数 2

分类专栏： pytorch

本文链接：https://blog.csdn.net/guls999/article/details/84971882

版权

pytorch 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

为了fine-tuning网络，经常会让有预训练参数的层的学习率比较小，而新的层的学习率比较大。然后看了网上很多的教程，都是这样去定义参数组的：

# eg.
import torch
from torchvision.models.vgg import vgg16_bn
from torch import optim

num_classes = 2
lr = 1e-3
model = vgg16_bn(pretrained=True)
model.classifier[6] = torch.nn.Linear(4096, 2)

params_group1 = list(map(id, model.classifier[6].parameters()))
params_group2 = filter(lambda p: id(p) not in params_group1, model.parameters())

optimizer = optim.Adam([{'params': params_group1, 'lr': lr},
                        {'params': params_group2, 'lr': lr*0.1}], lr=lr)

然后就会出现如下错误：
在这里插入图片描述
因为使用id(object)得到的是对象的内存地址，所以是int，因此将代码改成：

params_group1 = [params for params in model.classifier[6].parameters()]
params_group1_id = list(map(id, params_group1))
params_group2 = filter(lambda p: id(p) not in params_group1_id, net.parameters())

guls999

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Pytorch采用不同的学习率训练网络

Pytorch采用不同的学习率训练网络为了fine-tuning网络，经常会让有预训练参数的层的学习率比较小，而新的层的学习率比较大。然后看了网上很多的教程，都是这样去定义参数组的：# eg.import torchfrom torchvision.models.vgg import vgg16_bnfrom torch import optimnum_classes = 2lr ...
复制链接

扫一扫