pytorch加载部分参数训练

最新推荐文章于 2024-07-26 20:52:07 发布

ws_nlp_

最新推荐文章于 2024-07-26 20:52:07 发布

阅读量503

点赞数

分类专栏： pytorch

本文链接：https://blog.csdn.net/qq_33624866/article/details/107352996

版权

pytorch 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1.在加载了部分参数以后，直接另参数的requires_grad = False

self.encoder = BertModel.from_pretrained('bert-base-chinese')

        for i, p in enumerate(self.parameters()):
            p.requires_grad = False

2.优化器中去掉requires_grad = False 的参数

self.optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad, self.model.parameters()), lr=2e-6)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ws_nlp_

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

pytorch只加载预训练模型中的部分参数及冻结部分参数

yang_daxia的博客

08-26

7084

说明比如我需要训练车牌检测模型, 采用retinanet, 结构为bacnbone-fpn-retinanethead. 准备在coco数据集上预训练. 但是coco数据集有81类, 车牌只有几类. 预训练完以后, retinanethead部分, 由于类数目尺寸不匹配, 所以希望只加载bacnbone以及fpn部分的参数. 保存的checkpoints本质上为一个字典, 所以只需要把head部...

pytorch加载部分模型和参数

weixin_43632501的博客

08-13

4280

有时候任务需要，想从一个训练好的网络里提取部分网络和参数做为自己的网络，本文将教你如何用pytorch实现。首先看一下训练好的网络结构：这是一个seq2seq网络，包含encoder和decoder两部分，每一部分都包含一个embedding层、一个LSTM层和一个Dropout层，decoder网络还有一个Linear层。然后看一下新的网络结构：同样是一个seq2seq的结构，区别是...

参与评论您还未登录，请先登录后发表或查看评论

pytorch 模型部分参数的加载

y1556368418的博客

10-30

3096

如果对预训练模型的结构进行了一些改动，在训练的开始前希望加载未改动部分的参数，如将resnet18的第一层卷积层conv1的输入由3通道改为6通道的new_conv1，将分类层fc的1000类输出改为2类输出的new_fc，注意：要改一下名字与原来的不同。导入模型 myNet=resnet18() 然后就加载模型的参数，参考pytorch 如何加载部分预训练模型 pretrained_di...

Pytorch加载部分预训练模型的参数

最新发布

简简单单的学习笔记，致力于帮助更多前进路上的朋友~

07-26

288

Pytorch加载部分预训练模型的参数

pytorch加载模型中的部分参数

t20134297的博客

12-13

466

import torch import torch.nn as nn import torch.nn.functional as F from torchvision import datasets,transforms from torch.optim import lr_scheduler import torch.optim as optim class VGG(nn.Module): ...

使用PyTorch加载模型部分参数方法

TracelessLe的专栏

04-10

8966

前言在深度学习领域，经常需要使用其他人已训练好的模型进行改进或微调，这个时候我们通常会希望加载预训练模型文件的参数，如果网络结构不变，只需要使用load_state_dict方法即可。而当我们改动网络结构后，由于load_state_dict方法要求读入的state_dict的key和net.state_dict()的key对应相等，如果有缺少就会报错。这个时候我们通常希望加载未改动部分结构的参数用来初始化网络。方法方法一：strict=False 直接使用load_state_dict提供的参数s

Pytorch加载部分预训练模型的参数实例

09-18

本文将详细探讨如何在PyTorch中加载部分预训练模型的参数，并通过实例进行说明。首先，当我们使用的模型与预训练模型完全相同，我们可以直接加载预训练模型的所有参数。例如，如果我们有一个名为DPN的模型，我们...

PyTorch加载预训练模型实例(pretrained)

09-18

这里的 `pretrained=True` 参数告诉 PyTorch 我们想要加载预训练的权重。`models.resnet50()` 函数会返回一个已经训练好的 ResNet50 模型，其内部权重对应于在 ImageNet 上训练的结果。然而，通常我们需要对预训练...

pytorch加载预训练加载部分参数

jacke121的专栏

06-10

6920

pytorch加载预训练加载部分参数

Pytorch中实现只导入部分模型参数的方式

09-18

今天小编就为大家分享一篇Pytorch中实现只导入部分模型参数的方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

PyTorch的Optimizer训练工具的实现

09-18

主要介绍了PyTorch的Optimizer训练工具的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

pytorch如何加载部分模型参数

weixin_41449637的博客

09-11

4736

使用openpose pytorch版本查看中间热力图结果，需要加载部分参数，过程如下 1.把模型的结构加载进来 pretrained_dict = torch.load(model_body25) model = bodypose_25_model() 2.通过字典形式，加载网络中的部分参数 model_dict = model.state_dict() pretrained_dict = {k: v for k, v in pretrained_dict.items() if k in..

Pytorch如何部分加载模型参数

explorer5568的博客

03-30

916

Pytorch加载指定层的参数

木盏

04-06

3554

Pytorch加载模型的时候，有时候并不需要加载全部的模型参数。比如，做迁移学习的时候，我们将模型A的参数迁移到模型B上，这两个模型整体结构是不一样的，只是有些layer的是一样的，直接用model_b来load模型A的参数肯定会报错。我们只是想把模型A的部分参数加载到模型B上。

【学习1】Pytorch部分载入参数的几种方法

iviyandyssg的博客

07-06

1030

参考1 https://blog.csdn.net/LXX516/article/details/80124768 参考2 https://www.bilibili.com/video/BV1dA411g7Ao 方法一仅仅修改了全连接层，比如将分类层fc的1000类输出改为10类输出的new_fc import torch from torchvision.models import resnet18 import torch.nn as nn def main(): out_featu

Task08 word2vec；词嵌入进阶；文本分类学习笔记

Mufengfengfeng的博客

02-24

1156

Task08 word2vec；词嵌入进阶；文本分类学习笔记 word2vec 词嵌入基础我们在“循环神经网络的从零开始实现”一节中使用 one-hot 向量表示单词，虽然它们构造起来很容易，但通常并不是一个好选择。一个主要的原因是，one-hot 词向量无法准确表达不同词之间的相似度，如我们常常使用的余弦相似度。 Word2Vec 词嵌入工具的提出正是为了解决上面这个问题，它将每个词表示成一...

pytorch怎么加载预训练模型的部分参数

05-10

PyTorch是一个功能强大的机器学习框架。它使用动态计算图和高效的自动微分来加速深度学习。在实际编码的过程中，我们经常会使用预训练模型来加速模型训练和进一步提升模型准确率，不过一些时候我们并不需要整个预训练模型的所有参数来进行训练，而是只需要加载预训练模型的部分参数。那么在PyTorch中，我们要如何来加载预训练模型的部分参数呢？要想加载预训练模型的部分参数，在PyTorch中，我们可以使用load_state_dict()函数实现。load_state_dict()函数在PyTorch中是将参数拷贝到新模型中的函数，新模型和预训练模型的网络结构应该是相同的。然后我们可以通过load_state_dict()函数的参数prefix和exclude来实现部分参数的加载。prefix参数是指定了预训练模型中需要加载的参数的前缀，而exclude参数是指定了我们不需要加载的参数。例如，我们有一个预训练模型‘resnet18.pth’,它包含了resnet18模型在imagenet上训练好的模型参数。我们想要使用这个模型来进行一些迁移学习，那只需要加载resnet18最后一层fc层之前的所有模型参数，而不需要加载最后一层fc层的权重。那么，我们可以通过以下代码来实现： ``` import torch.utils.model_zoo as model_zoo import torchvision.models as models # 定义一个resnet18模型 resnet18 = models.resnet18(pretrained=False) # 加载预训练模型的所有参数 model_url = 'https://download.pytorch.org/models/resnet18-5c106cde.pth' resnet18.load_state_dict(model_zoo.load_url(model_url)) # 获取所有要加载的参数的名字 params_to_update = [] for name, param in resnet18.named_parameters(): if 'fc' not in name: params_to_update.append(name) # 加载部分预训练模型参数 state_dict = model_zoo.load_url(model_url) model_dict = resnet18.state_dict() for name, value in state_dict.items(): if name.startswith(tuple(params_to_update)): model_dict.update({name: value}) resnet18.load_state_dict(model_dict) ``` 上述代码先是定义了一个resnet18模型，然后加载resnet18预训练模型的所有参数。通过获取所有需要加载的参数的名字，然后将其加载到新模型中，从而实现了加载预训练模型的部分参数的目的。总结：通过使用load_state_dict()函数的prefix和exclude参数，在PyTorch中实现了对预训练模型的部分参数的加载。这将使我们在使用预训练模型时更加灵活和高效。