关于模型分成多部分时的torch.optim优化设置

最新推荐文章于 2024-07-22 20:08:14 发布

judgechen1997

最新推荐文章于 2024-07-22 20:08:14 发布

阅读量845

点赞数

分类专栏：代码积累 pytorch代码积累开发

本文链接：https://blog.csdn.net/judgechen1997/article/details/108583162

版权

pytorch代码积累同时被 3 个专栏收录

8 篇文章 0 订阅

订阅专栏

代码积累

5 篇文章 0 订阅

订阅专栏

开发

5 篇文章 1 订阅

订阅专栏

上次写代码时，backbone encoder是用了别人代码，另外又添加了多分支多layer作为task decoder。

但是开始犯了个很致命的错误，在pytorch设置优化器时，仅使用了:

optimizer = torch.optim.Adam(model.parameters(), lr=args.lr, weight_decay=args.weight_decay)

这样实际上只优化了部分模型，应该这样设置：

optimizer = torch.optim.Adam([{'params': model.parameters()},
                                  {'params': jigsaw_classifier.parameters()},
                                  {'params': element_classifier.parameters()}
                                  ],
                                 lr=args.lr, weight_decay=args.weight_decay)