深度学习加载预训练权重时冻结网络的部分参数

最新推荐文章于 2024-05-14 20:38:59 发布

Hello_CHL

最新推荐文章于 2024-05-14 20:38:59 发布

阅读量480

点赞数

文章标签：深度学习人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_50501767/article/details/129469125

版权

该文介绍如何在PyTorch中加载预训练模型权重，只保留与当前模型匹配的部分参数，并冻结除最后全连接层外的所有权重，用于后续的微调或特定层训练。使用`torch.load`加载权重，然后根据模型结构选择性地设置参数的`requires_grad`属性为False来冻结权重，只让最后的全连接层的参数参与训练。

摘要由CSDN通过智能技术生成

这里以除了最后的全连接层，冻结网络其他参数为例：

weigth_path = './net.pth'
weights_dict = torch.load(weight_path, map_location=device)

# 只保留和模型参数个数一个的预训练参数块
load_weights_dict = {k: v for k, v in weights_dict.items()
                                 if model.state_dict()[k].numel() == v.numel()}
# 加载权重
model.load_state_dict(load_weights_dict, strict=False)
    
for name, para in model.named_parameters():
    # 除最后的全连接层外，其他权重全部冻结，注意这里的fc是在定义模型时命名的一个块
    if "fc" not in name:
       para.requires_grad_(False)

# 这个变量保存所有训练的参数，是供之后优化器使用的
pg = [p for p in model.parameters() if p.requires_grad]

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Hello_CHL CSDN认证博客专家 CSDN认证企业博客

码龄4年

9: 原创

142万+: 周排名

24万+: 总排名

1万+: 访问

: 等级

147: 积分

40: 粉丝

52: 获赞

9: 评论

109: 收藏

私信

关注

热门文章

最新评论

深度学习图片数据读入
一个超级无敌小菜鸡: 如果图片里面有很多nodata怎么办呢，很多缺省值
使用旧版本数据库配置连接8.0+MySQL数据库问题解决
CSDN-Ada助手: 恭喜博主成功完成第9篇博客！标题看起来非常有吸引力，我相信这篇文章一定能帮助到许多使用旧版本数据库配置连接8.0+MySQL数据库的开发者。不过，我也想提供一些建议，希望能对你的下一步创作有所帮助。或许你可以考虑分享一些关于数据库性能优化的经验，或是介绍一些常见的数据库错误和解决方法。期待你的下一篇文章，继续努力哦！
将Xftp中的文件打开方式修改为自己的编辑器
CSDN-Ada助手: 恭喜您写了第8篇博客！标题中的内容引起了我的兴趣，我很期待了解如何将Xftp中的文件打开方式修改为自己的编辑器。您的博客一直以来都非常有启发性，帮助了我很多。感谢您持续创作，给我们带来这么多有价值的内容。在您下一步的创作中，我想提出一个谦虚的建议。考虑到读者可能有不同的编辑器偏好，是否可以介绍一些常见的编辑器，并分享如何将它们与Xftp集成，以便读者可以根据自己的喜好进行设置。这样的话，读者可以根据自己的需求选择合适的编辑器，而且也能更好地理解和应用您所分享的内容。期待您的下一篇博客，再次感谢您的努力和分享！
深度学习图片数据读入
裕仔: 感谢，救了我一命
深度学习图片数据读入
m0_57041733: 收到，谢谢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。