Pytorch 中的 torch.optim.swa_utils.AverageModel() 及其原理总结

怎样才能回到过去

已于 2023-01-31 09:35:39 修改

阅读量875

点赞数 1

分类专栏： Pytorch 中的各种函数文章标签： Pytorch Powered by 金山文档

于 2023-01-31 09:35:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Z2572862506/article/details/128811734

版权

Pytorch 中的各种函数专栏收录该内容

54 篇文章 1 订阅

订阅专栏

1 背景知识

在了解 torch.optim.swa_utils.AverageModel() 前, 我们先了解以下 SWA(随机加权平均)

1.1 SWA

SWA 全称 : Stochastic Weight Averaging,

SWA是使用修正后的学习率策略对SGD(或任何随机优化器)遍历的权重进行平均，从而可以得到更好的收敛效果

随机梯度下降(SGD)在测试集上，趋向于收敛至损失相对低的地方，但却很难收敛至最低点, 经过几个epoch的训练，得到了W1,W2,W3三个权重，但无法收敛至最低点。如果使用SWA可以将三个权重加权平均，从而可能收敛至相对SGD更小的损失

SGD在训练集收敛得比较好，但是在测试集效果并不如SWA。而SWA虽然在训练集收敛得不如SGD，但是在测试集上表现得更加好

2 AverageModel() 介绍

AveragedModel 类用于计算SWA模型的权重。可以通过运行以下命令创建一个averaged model:

from torch.optim.swa_utils import AverageModel
swa_model = AverageModel(model)

这里的模型Model可以是任意的torch.nn.Module对象。swa_model将跟踪模型参数的运行平均值。要更新这些平均值，你可以使用update_parameters()函数:

swa_model.update_parameters(model)

怎样才能回到过去

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Pytorch 中的 torch.optim.swa_utils.AverageModel() 及其原理总结

Pytorch 中的 torch.optim.swa_utils.AverageModel() 及其原理总结
复制链接

扫一扫

专栏目录

怎样才能回到过去 CSDN认证博客专家 CSDN认证企业博客

码龄2年

108: 原创

105万+: 周排名

189万+: 总排名

11万+: 访问

: 等级

1340: 积分

12: 粉丝

225: 获赞

35: 评论

511: 收藏

私信

关注

热门文章

分类专栏

最新评论

Python 中 shutil.copyfile() 函数总结
修车的小山竹: 无元数据是什么意思呀
Python 中的 __getitem__() 方法解析
李小小.: [code=python] 输出：('name', 1) [/code]
Python 中的 __getitem__() 方法解析
李小小.: [code=python] class datasets: def __init__(self, name, age): self.name = ['name', 'age', 'years'] self.age = [1, 2, 3, 4] # 定义特定属性为序列，并输出指定(key)序列中的值。 def __getitem__(self, key): return self.name[key], self.age[key] if __name__ == '__main__': a = datasets('wang', 23) print(a[0]) [/code]
Python 中的 accimage 模块
qq_44774975: import accimage出现下面错误无法解析导入“accimage” 这个怎么解决
Pytorch中返回super().forward()的用法
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。