pytorch 不同层设置不同学习率，并冻结某些参数

最新推荐文章于 2023-02-20 16:15:04 发布

沨汐

最新推荐文章于 2023-02-20 16:15:04 发布

阅读量312

点赞数

本文链接：https://blog.csdn.net/weixin_37961631/article/details/120639450

版权

深度学习学习率参数冻结 BERT 模型优化

关键词由CSDN通过智能技术生成

1、不同层不同学习率

2、冻结某些参数

for n,p in model.named_parameters():
    if 'bert' in n:p.requires_grad=False

同时在filter函数中添加：

non_embedding_param = list(filter(
            lambda x:id(x) not in embedding_param_ids and id(x) not in bert_embedding_param_ids and x.requireds_grad,
model.parameters()))

设置优化器

 optimizer = optim.SGD(param_,lr=args.lr,momentum=args.momentum,
                          weight_decay=args.weight_decay)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

沨汐

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytorch 不同层设置不同学习率，并冻结某些参数

1、不同层不同学习率2、冻结某些参数for n,p in model.named_parameters(): if 'bert' in n:p.requires_grad=False同时在filter函数中添加：non_embedding_param = list(filter( lambda x:id(x) not in embedding_param_ids and id(x) not in bert_embedding_param_...
复制链接

扫一扫