pytorch 中 torch.nn.Parameter()

最新推荐文章于 2023-11-28 10:52:23 发布

m0_46483236

最新推荐文章于 2023-11-28 10:52:23 发布

阅读量2.1k

点赞数 1

分类专栏： pytorch 文章标签： pytorch

本文链接：https://blog.csdn.net/m0_46483236/article/details/124020902

版权

pytorch 专栏收录该内容

25 篇文章 2 订阅

订阅专栏

一、官方教程：

网址：

torch.nn.parameter — PyTorch 1.11.0 documentation

二、代码解读：

torch.nn.Parameter(torch.Tensor) 是一个类，继承了torch.Tensor这个类，有两个参数：

data(Tensor): 给定一个tensor；
requires_grad: 指定是否需要梯度，默认为True；

通俗的解释：

首先可以把这个函数理解为类型转换函数，将一个不可训练的类型Tensor转换成可以训练的类型parameter并将这个parameter绑定到这个module里面(net.parameter()中就有这个绑定的parameter，所以在参数优化的时候可以进行优化的)，所以经过类型转换就变成了模型的一部分，成为了模型中根据训练可以改动的参数了。使用这个函数的目的也是想让某些变量在学习的过程中不断的修改其值以达到最优化。

三、实际应用：

比如，在GST中，需要定义多个Token当作计算attention的K、V，这里就用到了torch.nn.Parameter()，作为模型的一部分不断地修改优化。
主要是在模型类的 __init__()中，声明一下并标准化。

self.embed = nn.Parameter(torch.FloatTensor(8, 64))
init.normal_(self.embed, mean=0, std=0.5)

具体如下：

class STL(nn.Module):
    '''
    inputs --- [N, E//2]
    '''

    def __init__(self,model_config):

        super().__init__()
        self.embed = nn.Parameter(torch.FloatTensor(model_config["gst"]["n_style_token"], model_config["gst"]["E"] // model_config["gst"]["attn_head"]))
        d_q = model_config["gst"]["E"] // 2
        d_k = model_config["gst"]["E"] // model_config["gst"]["attn_head"]
        self.attention = MultiHeadAttention(query_dim=d_q, key_dim=d_k, num_units=model_config["gst"]["E"], num_heads=model_config["gst"]["attn_head"])

        init.normal_(self.embed, mean=0, std=0.5)

    def forward(self, inputs):
        N = inputs.size(0)
        query = inputs.unsqueeze(1)  # [N, 1, E//2]
        keys = F.tanh(self.embed).unsqueeze(0).expand(N, -1, -1)  # [N, token_num, E // num_heads]
        style_embed = self.attention(query, keys)

        return style_embed

此外，在使用attention时，如果需要自定义并随机初始化一个Q，也是同样的道理。

部分参考：

torch.nn.Parameter()_chenzy_hust的博客-CSDN博客_nn.parameter()

PyTorch里面的torch.nn.Parameter() - 简书 (jianshu.com)

m0_46483236

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytorch 中 torch.nn.Parameter()

一、官方教程：网址：torch.nn.parameter — PyTorch 1.11.0 documentation二、代码解读：torch.nn.Parameter(torch.Tensor) 是一个类，继承了torch.Tensor这个类，有两个参数：data(Tensor): 给定一个tensor； requires_grad: 指定是否需要梯度，默认为True；通俗的解释：首先可以把这个函数理解为类型转换函数，将一个不可训练的类型Tensor转换成可以训练的类型pa
复制链接

扫一扫