Python基础：register buffer

Galaxy.404

于 2024-07-16 17:51:48 发布

阅读量105

点赞数 3

分类专栏： Python基础文章标签： python 深度学习机器学习

本文链接：https://blog.csdn.net/weixin_62472350/article/details/140472650

版权

Python基础专栏收录该内容

10 篇文章 0 订阅

订阅专栏

模型保存下来的参数有两种：需要更新的 Parameter ，与是不需要更新的 buffer 。

在模型中，利用backward反向传播，可以通讨requires_grad来得到 buffer 和 parameter 的梯度信息，但是利用 optimizer 进行更新的是 parameter ， buffer 不会更新，这也是两者最重要的区别。这两种参数都存在于 model.state_dict()的OrderedDict中，也会随着模型”移动”(model.cuda())。

class my_model(nn.Module):
    def _init_ (self):
        super(my_model,self)._init_()
        self.conv = nn.conv2d(11,3,1,1)
        self.tensor =torch.randn(size=(1,1,5,5))
        self.register_buffer('my_buffer', self.tensor)
def forward(self,x):
    return self.conv(x)+self.my_buffer     # 这里不再是self.tensor

之后要输出就是model.my_buffer了。

Galaxy.404

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python基础：register buffer

在模型中，利用backward反向传播，可以通讨requires_grad来得到 buffer 和 parameter 的梯度信息，但是利用 optimizer 进行更新的是 parameter ， buffer 不会更新，这也是两者最重要的区别。这两种参数都存在于 model.state_dict()的OrderedDict中，也会随着模型”移动”(model.cuda())。模型保存下来的参数有两种：需要更新的 Parameter ，与是不需要更新的 buffer。
复制链接

扫一扫