NTM中register_buffer的用法

最新推荐文章于 2024-05-26 20:41:59 发布

phac123

最新推荐文章于 2024-05-26 20:41:59 发布

阅读量260

点赞数

分类专栏： Paper笔记文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_42596275/article/details/130886926

版权

Paper笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

用法解释

register_buffer()函数是PyTorch中nn.Module类提供的一个方法，用于注册模块的可学习缓存，即不参与模型训练但是在模型的前向计算中被使用的缓存。

具体来说，register_buffer(name, tensor)函数有两个参数：name和tensor。其中，name代表缓存的名称，tensor代表需要缓存的torch.Tensor类型的数据。调用register_buffer()函数后，指定的tensor会被自动添加到模块的可学习参数中，并且在模型进行前向计算的时候被缓存起来以加速计算过程。

需要注意的是，缓存的tensor是不参与反向传播过程的，即它们不会被梯度下降更新。因此，register_buffer()函数主要用于保存一些常量或者模型运行中固定的中间结果，这种中间结果在模型的训练和测试过程中都可以被使用到。

例子解释

import torch
class MyNN(torch.nn.Module):
    def __init__(self):
        super(MyNN, self).__init__()

        # 申请一个size为(3,)的register_buffer()内存空间
        self.register_buffer('my_buffer', torch.zeros(3))

    def forward(self, x):
        # 在my_buffer存储一些数据
        self.my_buffer[0] = 1
        self.my_buffer[1] = 2
        self.my_buffer[2] = 3

        # 对x和my_buffer进行加法运算
        out = x + self.my_buffer

        return out

# 创建MyNN类的实例
net = MyNN()
# 定义输入x
x = torch.ones(3)
# 进行前向计算
out = net(x)
print(out)