Pytorch buffer(register_buffer)

hxxjxw

已于 2023-03-08 17:02:19 修改

阅读量1.8k

点赞数 1

文章标签： Pytorch

于 2022-04-03 22:16:12 首次发布

本文链接：https://blog.csdn.net/hxxjxw/article/details/123945850

版权

回顾模型保存：torch.save(model.state_dict())，其中model.state_dict()是一个字典，里边存着我们模型各个部分的参数。在model中，我们需要更新其中的参数，训练结束将参数保存下来。但在某些时候，我们可能希望模型中的某些参数不更新（从开始到结束均保持不变），但又希望参数保存下来（model.state_dict() ），例如BN的running_mean和running_var, 它们在训练过程中是不需要训练的，但是需要在整个训练过程中维护这个mean和var值。这时我们就会用到 register_buffer()

即

模型中需要保存下来的参数包括两种:

一种是反向传播需要被optimizer更新的，称之为 parameter
一种是反向传播不需要被optimizer更新，称之为 buffer

第一种参数我们可以通过 model.parameters() 返回；第二种参数我们可以通过 model.buffers() 返回。

model.state_dict()会同时包含parameter和buffer

但不一定每个网络都会有buffer，像nn.Linear()就没有
import torch
from torch import nn

class MyModule(nn.Module):
    def __init__(self, input_size, output_size):
        super(MyModule, self).__init__()
        self.register_buffer('test',torch.rand(input_size, output_size))
        self.linear = nn.Linear(input_size, output_size)
    def forward(self, x):
        return self.linear(x)

model = MyModule(4, 2)
print(list(model.buffers()))
print(list(model.named_buffers()))
输出model.state_dict()会包含buffer的
import torch
from torch import nn
 
class MyModule(nn.Module):
    def __init__(self, input_size, output_size):
        super(MyModule, self).__init__()
        self.register_buffer('test',torch.rand(input_size, output_size))
        self.linear = nn.Linear(input_size, output_size)
    def forward(self, x):
        return self.linear(x)
 
model = MyModule(4, 2)
print(model.state_dict())

hxxjxw

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Pytorch buffer(register_buffer)

回顾模型保存：torch.save(model.state_dict())，model.state_dict()是一个字典，里边存着我们模型各个部分的参数。在model中，我们需要更新其中的参数，训练结束将参数保存下来。但在某些时候，我们可能希望模型中的某些参数参数不更新（从开始到结束均保持不变），但又希望参数保存下来（model.state_dict() ），这是我们就会用到 register_buffer()即模型中需要保存下来的参数包括两种:一种是反向传播需要被optimizer更新的.
复制链接

扫一扫