Pytorch固定参数训练

6 篇文章 1 订阅

《Pytorch固定参数训练》

记录一下固定训练参数的方法:

requires_grad参数设置

1、初始化时指定Variable,如下语句所示:

i = Variable(torch.randn(5,5), requires_grad=True)

2、对于自己定义的一些基本网络,Linear等:

self.linear = nn.Linear(config.hidden_size * 3, config.hidden_size)

是没有requires_grad传入的;使用:

for i in self.linear.parameters():
    i.requires_grad=False

3、网络模型中设置。在训练中想要固定网络的底层,可以令这部分网络对应的子图的参数requires_grad为False。这样在反向传播的过程中就不会计算这些参数对应的梯度。需要在nn.Module中直接插入如下语句:

for p in self.parameters():
    p.requires_grad=False

比如:

class RESNET_attention(nn.Module):
    def __init__(self, model, pretrained):
        super(RESNET_attetnion, self).__init__()
        self.resnet = model(pretrained)
        for p in self.parameters():
            p.requires_grad = False
        self.f = nn.Conv2d(2048, 512, 1)
        self.g = nn.Conv2d(2048, 512, 1)
        self.h = nn.Conv2d(2048, 2048, 1)
        self.softmax = nn.Softmax(-1)
        self.gamma = nn.Parameter(torch.FloatTensor([0.0]))
        self.avgpool = nn.AvgPool2d(7, stride=1)
        self.resnet.fc = nn.Linear(2048, 10)

这样就将for循环以上的参数固定,只训练下面的参数,f,g,h,gamma等等。

最后一步需要对优化器限制:

optimizer = optim.Adam(filter(lambda p: p.requires_grad, model.parameters()), lr=0.0001, betas=(0.9, 0.999), eps=1e-08, weight_decay=1e-5)
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
在使用PyTorch进行训练时,我们可以通过多种方式来固定某一层参数,以确保它们在反向传播过程中不会被更新。 一种常见的方法是通过将参数的`requires_grad`属性设置为False来固定参数。`requires_grad`是一个布尔值,默认为True,它指示是否计算梯度。当我们将其设置为False时,即可固定该层的参数。例如,假设我们要固定模型的第二层,可以使用以下代码: ``` import torch import torch.nn as nn class MyModel(nn.Module): def __init__(self): super(MyModel, self).__init__() self.layer1 = nn.Linear(10, 20) self.layer2 = nn.Linear(20, 30) self.layer3 = nn.Linear(30, 40) def forward(self, x): x = self.layer1(x) x = self.layer2(x) x = self.layer3(x) return x model = MyModel() model.layer2.requires_grad = False # 在训练过程中,只有模型中非固定参数会更新 ``` 在这个例子中,我们将模型的第二层的`requires_grad`属性设置为False,这样在训练过程中,只有模型中没有被固定参数会更新。 除了通过设置`requires_grad`属性来固定参数外,我们还可以选择性地为不同的参数组设置不同的学习率或优化器。例如,我们可以将固定参数放入一个单独的参数组,并将其学习率设置为零,以确保固定参数不会被更新。 总的来说,通过设置`requires_grad`属性或选择性地设置学习率和优化器,我们可以在训练过程中灵活地固定某一层参数,以满足不同的需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

彭伟_02

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值