.requires_grad固定部分参数进行网络训练

最新推荐文章于 2024-05-07 18:07:46 发布

Code_demon

最新推荐文章于 2024-05-07 18:07:46 发布

阅读量667

点赞数 2

分类专栏：深度学习文章标签： pytorch 深度学习 python

本文链接：https://blog.csdn.net/qq_43489708/article/details/124617806

版权

深度学习专栏收录该内容

14 篇文章 2 订阅

订阅专栏

本文介绍了如何在PyTorch中只训练网络的部分层，通过设置`.requires_grad=False`来固定参数，以及在optimizer中使用过滤器确保仅更新所需参数。此外，还展示了检查参数是否固定、查看可训练参数、网络总参数的方法，并讨论了为不同层设置不同学习率的可能性。最后，提到了如何在PyTorch中实现部分网络更新的技巧。

摘要由CSDN通过智能技术生成

.requires_grad固定部分参数进行网络训练

文章目录

- .requires_grad固定部分参数进行网络训练

1. 只训练部分层


class RESNET_attention(nn.Module):
    def __init__(self, model, pretrained):
        super(RESNET_attetnion, self).__init__()
        self.resnet = model(pretrained)
        for p in self.parameters():
            p.requires_grad = False
        self.f = nn.Conv2d(2048, 512, 1)
        self.g = nn.Conv2d(2048, 512, 1)
        self.h = nn.Conv2d(2048, 2048, 1)
        self.softmax = nn.Softmax(-1)
        self.gamma = nn.Parameter(torch.FloatTensor([0.0]))
        self.avgpool = nn.AvgPool2d(7, stride=1)
        self.resnet.fc = nn.Linear(2048, 10)

这样就将for循环以上的参数固定, 只训练下面的参数。但是注意需要在optimizer中添加上这样的一句话filter(lambda p: p.requires_grad, model.parameters()。

optimizer = optim.Adam(filter(lambda p: p.requires_grad, model.parameters()), lr=0.0001, betas=(0.9, 0.999), eps=1e-08, weight_decay=1e-5)

2. 固定部分层参数

for k,v in model.named_parameters():
     if k!='XXX':
         v.requires_grad=False # 固定参数

3.检查部分参数是否固定

for k,v in model.named_parameters():
    if k!='xxx.weight' and k!='xxx.bias' :
            print(v.requires_grad) # 理想状态下，所有值都是False

4.查看可训练参数

for name, param in model.named_parameters():
    if param.requires_grad:
        print(name)

5.查看网络总参数

net = Model()
print('# Model parameters:', sum(param.numel() for param in net.parameters()))

6. 不同层设置不同学习率

在这里插入图片描述

7. PyTorch更新部分网络，其他不更新

在这里插入图片描述
引用：Jeanshoe博客

Code_demon

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
.requires_grad固定部分参数进行网络训练

.requires_grad固定部分参数进行网络训练文章目录.requires_grad固定部分参数进行网络训练1. 只训练部分层2. 固定部分层参数3.检查部分参数是否固定4.查看可训练参数5.查看网络总参数6. 不同层设置不同学习率7. [PyTorch](https://so.csdn.net/so/search?q=PyTorch&spm=1001.2101.3001.7020)更新部分网络，其他不更新1. 只训练部分层class RESNET_attention(nn.Module
复制链接

扫一扫

专栏目录