Pytorch冻结预训练权重(特征提取与BN层)

最新推荐文章于 2024-07-25 10:52:13 发布

不变强不改名

最新推荐文章于 2024-07-25 10:52:13 发布

阅读量3.1k

点赞数 5

分类专栏： Pytorch 文章标签： pytorch 迁移学习

本文链接：https://blog.csdn.net/m0_58772523/article/details/121465255

版权

本文介绍了如何在PyTorch中使用迁移学习，详细阐述了读取预训练权重、适应模型参数、冻结特征提取层权重以及特别处理BN层权重冻结的过程，确保在不更新这些层的情况下进行模型训练。

摘要由CSDN通过智能技术生成

1. 读取预训练权重

pre_weights = torch.load(model_weights_path, map_location=device)

2. 读取预训练权重中与现有模型参数设置相同层的权重，可适用于修改了分类或某些层通道数的情况

net = yourmodel()
pre_dict = {k: v for k, v in pre_weights.items() 
    if net.state_dict()[k].numel() == v.numel()}
# strict = False 表示仅读取可以匹配的权重
missing_keys, unexpected_keys = net.load_state_dict(pre_dict, strict = False)

3. 冻结特征提取层预训练权重

for params in net.features.parameters():
    params.requires_grad = False

4. 由于BN层参数是由各通道值计算得出，在forward中自动实现，而不是通过梯度计算和反向传播更新，需额外冻结BN层权重

def freeze_bn(ly):
    classname = ly.__class__.__name__
    if classname.find('BatchNorm') != -1:
        ly.eval()
net.apply(fre

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

不变强不改名

关注关注

5
点赞
踩
17

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

模型训练——使用预训练权重、冻结训练以及断点恢复

qq_43199575的博客

06-07

296

一般来讲，从0开始训练效果会很差，因为权值太过随机，特征提取效果不明显，所以训练时不好收敛，尤其是针对数据较少的情况。

终于知道为什么要freeze BN层，以及如何freeze(这个trick真的可以加快收敛）

最新发布

weixin_53880910的博客

07-25

689

本文介绍了微调的概念，需要微调的情况，微调的步骤，微调和参数冻结的几种实现方式。在讲关于模型的冻结、微调前，需要引入一个概念，叫迁移学习。迁移学习是指利用旧知识来学习新知识，主要目标是将已经学会的知识很快地迁移到一个新的领域中。

pytorch：子模型参数冻结 + BN冻结

薛定谔的猫头咕咕咕

05-27

2770

使用场景：需要完全冻结某部分的 weight 加载预训练模型时，如果只将 para.requires_grad = False ，并不能完全冻结模型的参数，因为模型中的 BN 层并不随 loss.backward() 与 optimizer.step() 来更新，而是在模型 forward 的过程中基于动量来更新，因此需要每个 forward 之前冻结 BN 层：完整的冻结方式如下： # 冻结BN def freeze_bn(m): classname = ly.__class__.__na

【pytorch】freeze

JNing

09-22

541

pytorch权重加载以及冻结部分权重设置

weixin_45453121的博客

07-22

554

冻结部分参数进行训练。

Pytorch FrozenBatchNorm (BN)

hxxjxw的博客

10-05

1886

Pytorch FrozenBatchNorm (BN)

PyTorch载入预训练权重方法和冻结权重方法_xception的预训练权重pytorch

m0_61330806的博客

04-06

305

如果这里的与我们训练的网络不同，一般指的是包含大于模型参数时，可以修改为。

pytorch之添加BN的实现

09-18

在PyTorch中，添加批标准化（Batch Normalization, BN）是提高深度学习模型训练效率和性能的关键技术之一。批标准化的主要目标是规范化每层神经网络的输出，使其服从接近零均值、单位方差的标准正态分布，从而加速...

浅谈pytorch中的BN层的注意事项

09-16

在PyTorch中，Batch Normalization（BN）层是一个重要的模块，用于加速深度神经网络的训练过程并提高模型的泛化能力。BN层通过规范化每一层的激活输出，使其接近于均值为0，方差为1的标准正态分布，从而稳定网络的...

pytorch 冻结参数

Jasminexjf的博客

06-30

7067

part one: 一篇博客的介绍： Pytorch的load方法和load_state_dict方法只能较为固定的读入参数文件，他们要求读入的state_dict的key和Model.state_dict()的key对应相等。而我们在进行迁移学习的过程中也许只需要使用某个预训练网络的一部分，把多个网络拼和成一个网络，或者为了得到中间层的输出而分离预训练模型中的Sequential 等等，...

pytorch不加载fc_pytorch预训练

weixin_39745013的博客

02-11

726

Pytorch预训练模型以及修改pytorch中自带几种常用的深度学习网络预训练模型，torchvision.models包中包含alexnet、densenet、inception、resnet、squeezenet、vgg等常用网络结构，并且提供了预训练模型，可通过调用来读取网络结构和预训练模型(模型参数)。往往为了加快学习进度，训练的初期直接加载pretrain模型中预先训练好的参数。加载m...

pytorch加载网络权重并冻结部分权重

YellowYi的博客

05-27

2636

需求构建一个新的网络，加载一个已经训练好的网络的公共部分。解决 import torch from UnetModelsCuaseNotPadding_TwoStreamT2 import CRN_Net def fix_bn(m): classname = m.__class__.__name__ if classname.find('BatchNorm') != -1: m.eval() model = CRN_Net() pretext_model = tor

pytorch冻结模型的权重，不反向传播

qq_41166909的博客

04-07

2298

以下是一个简单的示例代码，展示如何固定模型权重并不进行反向传播，只对最后一层全连接层的权重进行更新。进行前向计算，只有最后一层全连接层的参数需要更新，因此只对这一层的参数进行了反向传播和优化。通过以上步骤，即可冻结模型权重，只对需要更新的参数进行优化。的参数进行优化，以避免对不需要更新的参数进行无效的计算。4.在进行训练时，只对需要更新的参数进行反向传播和优化。为例，表示只对模型中最后一层全连接层的参数进行更新。3.在训练过程中，将需要更新的参数传入优化器中。2.对于需要更新的参数，将其。

pytorch 利用vgg16_bn进行特征提取，然后进行分类

GeneralJing的专栏

01-14

1472

构建网络： import torch import torchvision.models as models class VGG(torch.nn.Module): def __init__(self, vgg='vgg16_bn', data_set='CIFAR10', pretrained=False): super(VGG, self).__init__() self.features = models.__dict__[vgg](pretrained=

pytorch bn 如何冻结以及train 和val下区别

qq_17792451的博客

08-09

919

如何冻结一般要冻结特征提取层（pretrain layer）的bn 还有一些自己定义的bn不应该冻结因此在自己的model里重写train #示例程序在自己写的model里添加 def train(self, mode=True): """ Override the default train() to freeze the BN parameters """ super(fintuneNet, self).train(m

pytorch融合conv和bn

qq_22751305的博客

05-19

1093

pytorch融合卷积层和bn层

retina-net中为什么冻结BN层,

qq_29007291的博客

01-24

2378

pytorch使用预训练权重

08-09

### 回答1： PyTorch使用预训练权重的方法通常包括以下几个步骤： 1. 选择需要使用的预训练模型。PyTorch官方提供了许多流行的预训练模型，如ResNet、VGG、Inception等，可以在torchvision.models中找到。 2. 加载预训练权重。可以使用torchvision.models中的预训练模型的load_state_dict()方法来加载预训练权重，或者直接使用torch.load()方法加载已经保存好的预训练权重。 3. 将模型适配到自己的任务上。根据自己的任务需要，可以修改预训练模型的最后一层或几层，或者在预训练模型之上添加新的层。 4. 训练模型。使用加载了预训练权重的模型进行训练，通常需要在训练过程中冻结预训练模型的部分层参数，只对需要修改的层进行训练。以上是使用预训练权重的一般流程，具体实现可以参考PyTorch官方文档中的示例代码。 ### 回答2： PyTorch是一种流行的深度学习框架，使我们能够方便地使用预训练权重进行模型初始化，进而提升模型的性能和加快训练速度。 预训练权重是在大规模数据集上训练好的模型参数。使用预训练权重的好处是，它们包含了在大量数据上学习到的有用特征，可以作为模型初始化的一种方式。在PyTorch中，我们可以通过下载预训练权重来使用它们。例如，torchvision包提供了从ImageNet数据集预训练的许多常用模型，如ResNet、VGG、AlexNet等。通过使用这些预训练权重，我们可以获得在图像识别任务上具有很高准确性的模型。使用预训练权重的步骤如下： 1. 首先，导入PyTorch和所需的预训练权重模型。 2. 创建模型实例，并加载预训练权重。 3. 将模型设置为评估模式，即不进行梯度计算。 4. 输入新的数据进行预测。在加载预训练权重时，我们可以选择冻结一部分或全部权重。冻结权重意味着它们在训练过程中将保持不变，只有其他参数会更新。这对于微调模型非常有用，即在新数据集上进行训练，以适应特定任务。当我们使用预训练权重时，模型通常能够更快收敛，并且在训练集上获得更好的初始性能。然而，对于特定任务，预训练权重可能不一定是最佳选择。在某些情况下，我们可能需要进行微调或自定义的权重。使用PyTorch的预训练权重，我们能够方便地利用先前在大规模数据集上训练的模型参数，从而加速模型训练并提高模型性能。 ### 回答3： PyTorch是一个流行的深度学习框架，可以使用预训练模型权重来帮助我们快速建立和训练模型。预训练权重是在大规模数据集上预训练的模型参数，可以作为初始参数或微调参数用于特定任务。使用预训练权重的第一步是选择适合任务的模型架构。PyTorch提供了一系列常用的预训练模型，如ResNet、VGG、AlexNet等。你可以根据任务的需求选择合适的模型。下载预训练权重是接下来的一步。PyTorch通过torchvision提供了一种简便的方式来下载和加载预训练权重。你可以使用torchvision.models模块中的函数，如resnet50(pretrained=True)来下载ResNet-50的预训练权重。加载预训练权重后，你可以将其应用于你的任务。如果你希望在预训练权重的基础上微调模型，则需要冻结一些层，只更新部分参数。通过设置requires_grad为False，可以冻结权重，使其不参与梯度更新。一旦你完成了模型的设置和参数初始化，就可以开始训练了。你可以使用预训练权重作为模型的初始参数，让模型更快地收敛和获得更好的性能。需要注意的是，预训练权重通常是在大规模数据集上训练得到的，因此可能适用于许多相关任务。然而，如果你的任务与预训练模型的训练数据具有很大的差异，可能需要进行微调或重新训练以适应你的任务。总而言之，PyTorch提供了便捷的方式来使用预训练权重，通过应用预训练权重，我们可以更快地构建和训练模型，并获得更好的性能。