Pytorch模型中的parameter与buffer

最新推荐文章于 2024-01-27 19:54:56 发布

CV/NLP大虾

最新推荐文章于 2024-01-27 19:54:56 发布

阅读量677

点赞数

分类专栏： pytorch

本文链接：https://blog.csdn.net/m0_37400316/article/details/106669378

版权

pytorch 专栏收录该内容

26 篇文章 2 订阅

订阅专栏

Parameter 和 buffer

If you have parameters in your model, which should be saved and restored in the state_dict, but not trained by the optimizer, you should register them as buffers.Buffers won’t be returned in model.parameters(), so that the optimizer won’t have a change to update them.

模型中需要保存下来的参数包括两种:

一种是反向传播需要被optimizer更新的，称之为 parameter
一种是反向传播不需要被optimizer更新，称之为 buffer

第一种参数我们可以通过 model.parameters() 返回；第二种参数我们可以通过 model.buffers() 返回。因为我们的模型保存的是 state_dict 返回的 OrderDict，所以这两种参数不仅要满足是否需要被更新的要求，还需要被保存到OrderDict。

那么现在的问题是这两种参数如何创建呢，创建好了如何保存到OrderDict呢？

第一种参数有两种方式:

我们可以直接将模型的成员变量(http://self.xxx) 通过nn.Parameter() 创建，会自动注册到parameters中，可以通过model.parameters() 返回，并且这样创建的参数会自动保存到OrderDict中去；
通过nn.Parameter() 创建普通Parameter对象，不作为模型的成员变量，然后将Parameter对象通过register_parameter()进行注册，可以通model.parameters() 返回，注册后的参数也会自动保存到OrderDict中去;
第二种参数我们需要创建tensor, 然后将tensor通过register_buffer()进行注册，可以通model.buffers() 返回，注册完后参数也会自动保存到OrderDict中去。

CV/NLP大虾

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Pytorch模型中的parameter与buffer

Parameter 和 bufferIf you have parameters in your model, which should be saved and restored in the state_dict, but not trained by the optimizer, you should register them as buffers.Buffers won’t be returned in model.parameters(), so that the optimizer won’
复制链接

扫一扫

专栏目录