【pytorch】固定模型部分权重进行训练

阿委困的不能行

已于 2023-06-21 19:20:40 修改

阅读量1.4k

点赞数

文章标签： pytorch python 人工智能深度学习

于 2023-06-21 16:12:59 首次发布

原文链接：https://blog.csdn.net/HUSTHY/article/details/104006106

版权

前言

在深度学习领域，经常需要使用其他人已训练好的模型进行改进或微调，这个时候我们会加载已有的预训练模型文件的参数，如果网络结构不变，希望使用新数据微调部分网络参数。这时我们则需要冻结部分参数，禁止其更新。

做法

做法非常简单。

参考这篇博客：https://blog.csdn.net/HUSTHY/article/details/104006106

其实只需要设置model的parameter的requires_grad=False，如下下面：

    for name, param in model.named_parameters():    #遍历模型的所有层
        if param.requires_grad:
            print(name)
            print(param)
            	if name=='backbone.layers.11.ffn.layers.0.0.bias'：
                	param.requires_grad = False     #固定该层参数

对优化器的设置

有些文章说需要设置optimizer，让optimizer不去传播这模型，比如参考博客中提到的：

#只对p中requires_grad=True代码进行训练，加过滤器filter把requires_grad = False的参数过滤掉，在训练的时候，不会更新这些参数
optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad, model.parameters()), lr=0.00001)

我发现在后面较高的pytorch（>1.8）版本上不需要这样，只需要正常设置optimizer即可：

optimizer = torch.optim.Adam(model.parameters()), lr=0.00001)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

阿委困的不能行

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

如何在 PyTorch 中冻结模型权重以进行迁移学习：分步教程

gongdiwudu的专栏

10-10

6286

迁移学习是一种机器学习技术，其中预先训练的模型适用于新的但类似的问题。迁移学习的关键步骤之一是能够冻结预训练模型的层，以便在训练期间仅更新网络的某些部分。当您想要保留预训练模型已经学习的特征时，冻结至关重要。在本教程中，我们将使用一个简单的示例来演示在 PyTorch 中冻结权重以进行迁移学习的过程。

PyTorch 微调终极指南：第 1 部分 — 预训练模型及其配置

gongdiwudu的专栏

08-09

7824

如今，在训练深度学习模型时，通过在自己的数据上微调预训练模型来迁移学习已成为首选方法。通过微调这些模型，我们可以利用他们的专业知识并使其适应我们的特定任务，从而节省宝贵的时间和计算资源。本文分为四个部分，侧重于微调模型的不同方面。

参与评论您还未登录，请先登录后发表或查看评论

pytorch---之固定某些层权重再训练

zxyhhjs2017的博客

03-09

4575

1.children()这个方法，就是将网络中的模块化，可以自己动手试试看 2.然后prameters就是每一个模块里面的参数，或者是所有网络的参数都可以，相当于对一个模块或者所有网络里的参数requires_grad都设置为false,相当于这些模块里的参数都不再反传梯度了 3.再在优化器这里加一点东西，如下所示： optimizer = torch.optim.RMSprop(fi...

Pytroch进行模型权重初始化

qq_43428929的博客

07-20

3957

Pytroch常见的模型参数初始化方法有apply和model.modules()。Pytroch会自动给模型进行初始化，当需要自己定义模型初始化时才需要这两个方法。

pytorch固定部分参数进行网络指定层训练

甜度超标的博客

12-29

6808

pytorch固定部分参数进行网络指定层训练训练问题描述实现方法问题描述类似迁移学习，将模型权重加载进来之后，固定指定层的参数，进行剩余层的训练，并且固定层的参数不在更新，只更新训练的部分。实现方法 ...

pytorch冻结模型的权重，不反向传播

qq_41166909的博客

04-07

2583

以下是一个简单的示例代码，展示如何固定模型权重并不进行反向传播，只对最后一层全连接层的权重进行更新。进行前向计算，只有最后一层全连接层的参数需要更新，因此只对这一层的参数进行了反向传播和优化。通过以上步骤，即可冻结模型权重，只对需要更新的参数进行优化。的参数进行优化，以避免对不需要更新的参数进行无效的计算。4.在进行训练时，只对需要更新的参数进行反向传播和优化。为例，表示只对模型中最后一层全连接层的参数进行更新。3.在训练过程中，将需要更新的参数传入优化器中。2.对于需要更新的参数，将其。

PyTorch项目应用实例(八)固定权重|顺序训练网络

祥瑞的技术博客

05-28

3441

背景：需要将模型分层训练，不能同时训练。即固定一部分权重训练另一部分。目录一、多输出网络 1.1 heads多输出 1.2 最终的输出二、loss更新网络的方法 2.1 loss位置 2.2 criterion定义 2.3 optimizer定义 2.4 定义顺序汇总三、更改相应代码 3.1 定义需要优化的参数 3.2 更改学习率 3.3 网络loss及结构一...

torch 迁移学习固定指定部分权重

蓝羽飞鸟的博客

05-08

367

迁移学习，固定权重

ConvNeXtv2 pytorch预训练权重转paddle

weixin_55395846的博客

03-22

682

ConvNeXt v2 pytorch权重转paddle

pytorch 关于权重（初始化、固定）

一位浪漫的极客

04-09

3218

权重初始化： emb那种可以直接from_pretrained 固定权重利用requires_grad=False，这样只是不更新，但是还是会计算并占用显存 class Net(nn.Module): def __init__(self): super(Net, self).__init__() self.conv1 = nn.Conv2d...

PyTorch模型权重初始化全攻略

xziyuan的博客

07-08

650

Pytroch常见的模型参数初始化方法有apply和model.modules()。Pytroch会自动给模型进行初始化，当需要自己定义模型初始化时才需要这两个方法。

Pytorch 实现冻结指定卷积层的参数

09-18

今天小编就为大家分享一篇Pytorch 实现冻结指定卷积层的参数，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

从零搭建Pytorch模型教程（五）编写训练过程--一些基本的配置

热门推荐

Jee_King的博客

01-13

1万+

找了一些资料，对我这种菜鸟并不友好，把自己摸索的相对详细的过程记录一下。 pytorch 加载全部模型比较简单，直接使用如下代码: net.load_state_dict(torch.load(pth_path)) 现在只想使用上述net（假设叫net-a）的中间的一部分模型，步骤如下：根据net-a的网络模型代码（如下），新建一个副本网络模型net-b代码。 class Net...

Pytorch如何约束神经网络中权重/偏置的范围

极歌科技

02-04

7109

方法一：首先编写模型结构： class Model(nn.Module): def __init__(self): super(Model,self).__init__() self.l1=nn.Linear(100,50) self.l2=nn.Linear(50,10) self.l3=nn.Linear(10,1)...

pytorch权重加载以及冻结部分权重设置

weixin_45453121的博客

07-22

715

冻结部分参数进行训练。

Pytorch——训练时，冻结网络部分参数的方法

Williamcsj的博客

04-17

3228

要固定训练网络的哪几层，只需要找到这几层参数(parameter)，然后将其 `.requires_grad` 属性设置为 `False` 。然后`修改优化器`，只将不被冻结的层传入。

如何固定权重，对某些层得学习率改为0？

qq_44089890的博客

05-02

1287

在训练深度神经网络时，有时需要固定某些层或参数不进行更新。可以使用PyTorch提供的nn.Module中的parameters()方法来获得所有需要学习的参数，并使用torch.optim.SGD()等优化器的param_groups参数来控制不同层的学习率。通过将学习率设为0，就可以固定某些层或参数的权重。在上面的代码中，我们将第1个全连接层的权重设为0.01的学习率，第1个全连接层的偏置设为0.02的学习率。我们还将第1个卷积层和第2个卷积层的权重都设置为0的学习率。

pytorch官方预训练权重

06-05

PyTorch官方提供了大量的预训练模型权重，这些模型通常是在大规模数据集上进行训练得到的，比如ImageNet等，它们在许多计算机视觉任务上表现出色，可以显著提高模型的性能。这些预训练权重可以通过`torchvision.models`模块轻松获取，如ResNet、VGG、Inception、BERT等深度学习模型。例如，如果你想要加载一个经典的图像分类模型，如ResNet50，你可以这样做： ```python import torch from torchvision import models model = models.resnet50(pretrained=True) ``` 这里`pretrained=True`表示加载预训练权重。预训练的模型参数是固定的，可以直接使用，而后面的自定义层则会从随机初始化变为训练状态。使用预训练权重的好处包括： 1. 初始化模型时跳过了漫长的训练过程，节省时间。 2. 有时可以作为特征提取器，提取底层的抽象特征。 3. 避免陷入局部最优，因为预训练模型在大数据集上经过优化。