pytorch weight decay_pytorch 两种冻结层的方式

最新推荐文章于 2022-10-26 12:30:24 发布

weixin_39543758

最新推荐文章于 2022-10-26 12:30:24 发布

阅读量169

点赞数

文章标签： pytorch weight decay

v2-1f3f689cdf01b7c1b1fec267e0549e7f_1440w.jpg?source=172ae18b

pytorch 两种冻结层的方式

一、设置requires_grad为False

for

这种方法需要注意的是层名一定要和model中一致，model经过.cuda后往往所用层会添加module.的前缀，会导致后面的冻结无效。

还需要注意的是加上filter：

optimizer

二、使用 torch.no_grad()

这种方式只需要在网络定义中的forward方法中，将需要冻结的层放在 torch.no_grad()下，强力推这种方式。

class

这种方式则是将layer1和layer2定义的层冻结，只训练fc层的参数。

当然还有其它方式，有好的方法欢迎大家讨论。

weixin_39543758

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytorch weight decay_pytorch 两种冻结层的方式

pytorch 两种冻结层的方式一、设置requires_grad为Falsefor 这种方法需要注意的是层名一定要和model中一致，model经过.cuda后往往所用层会添加module.的前缀，会导致后面的冻结无效。还需要注意的是加上filter：optimizer 二、使用 torch.no_grad()这种方式只需要在网络定义中的forward方法中，将需要冻结的层放在 torch.no...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。