Pytorch 加载预训练模型，固定部分模型微调，但是固定部分输出结果不同的原因

最新推荐文章于 2023-09-27 16:30:27 发布

SeanCYX_007

最新推荐文章于 2023-09-27 16:30:27 发布

阅读量1.1k

点赞数 8

分类专栏： Pytorch 文章标签： pytorch batch python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SeanCYX_007/article/details/119035387

版权

pytorch的batchnorm层会在训练模式下改变计算参数，导致看似固定实则依旧在改变的情况

摘要由CSDN通过智能技术生成

遇到问题发现并网上并没有相似的情况和解答，记录一下Pytorch BatchNorm踩的坑。

目录

问题描述
原因
解决方案

问题描述

保存训练好了的一个目标检测模型a，然后设计的新模型b有部分结构和a相同，backbone和fpn均为相同的结构，除了检测头略有区别。
创建新模型b，并加载模型a相同部分的state_dict，固定backbone和fpn部分，finetune模型b的检测头。但是感觉结果有问题，于是开始寻找问题根源。
经过一番查找，发现模型a经过训练后backbone输出的结果竟然和模型b的backbone输出结果不一样？？？这是什么情况？设置backbone每层的requires_grad为False，但是没有固定住？？？

原因

经过debug，发现是batchnorm2d这一层输出有问题，问题出在running_mean和running_var。这两个变量不是可学习参数，而是存在buffer中的，在torch.save_state_dict() 的时候会保存起来，但是在被加载后，当模型设置为.train()的finetune的时候还是会进行变化，也就是说用requires_grad=False并不能将这两个变量固定住，只能将bn.weights和bn.bias固定住，每一次训练还是会改变两个变量的值。而在推理阶段，模型设置为.eval()的时候，这两个变量是固定住的，而且bn在此阶段计算时使用的就是ru

最低0.47元/天解锁文章

关注

8
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
Pytorch 加载预训练模型，固定部分模型微调，但是固定部分输出结果不同的原因

pytorch的batchnorm层会在训练模式下改变计算参数，导致看似固定实则依旧在改变的情况
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。