pytorch上锁住整个网络结构的参数，报错：ValueError: optimizing a parameter that doesn't require gradients

最新推荐文章于 2024-01-12 20:34:34 发布

猫猫与橙子

最新推荐文章于 2024-01-12 20:34:34 发布

阅读量1.7k

点赞数

分类专栏：深度学习pytorch使用文章标签： pytorch 固定参数

本文链接：https://blog.csdn.net/qq_22764813/article/details/91379188

版权

深度学习pytorch使用专栏收录该内容

18 篇文章 5 订阅

订阅专栏

使用场景：最近在复现《Triplet Distillation for deep face recognition》的蒸馏方法，使用深度学习框架pytorch。两个网络，一个网络要固定住参数，loss不回传，参数不更新；另一个网络使用第一个网络的loss进行loss计算，进行正常的网络更新学习；

网上找到一些方法：参考：https://blog.csdn.net/AManFromEarth/article/details/81071823

#对于模型的每个权重，使其不进行反向传播，即固定参数
for param in model.parameters():
    param.requires_grad = False

然后我自己就尝试了一番：

checkpoint = torch.load(pt_path)
        state_dict = {k.replace("module.", ""): v for k, v in checkpoint.items()}
        model.load_state_dict(state_dict)
        for k, v in model.named_parameters():
            print(k)
            v.requires_grad = False  # 固定参数

然后在优化器的位置报错：

报错位置：

self.optimizer = optim.SGD(filter(lambda p: p.requires_grad, self.model.parameters()),
                #                                   lr=conf.lr, momentum=conf.momentum)

报错形式：

ValueError: optimizing a parameter that doesn't require gradients

错误原因：根据对参考文献的理解，是因为我将所有的参数锁死了，没有参数用于回传更新出的错，所以，我直接将要进行迁移学习（蒸馏）模型的参数放入这里：

 self.optimizer = optim.SGD(self.model_mobile.parameters(),
                             lr = conf.lr, momentum = conf.momentum)

注：self.model_mobile是需要进行迁移学习的模型；

同时在将模型参数传入gpu后，固定参数的大网络，直接使用了测试模式（self.model.eval()）进行特征图提取，然后传入loss函数中，进行loss值计算；

这样就成功锁着了网络参数；

验证网络参数锁没锁住的方法，我是查看的测试集上的测试精度，（感觉不太有说服力，大家有好的方法可以推荐下）

猫猫与橙子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录