脑电信号处理——加入通道注意力（利用可训练张量）

梁小憨憨

已于 2023-03-10 12:02:28 修改

阅读量817

点赞数 1

分类专栏：信号处理文章标签：信号处理深度学习 pytorch

于 2023-02-08 15:35:40 首次发布

本文链接：https://blog.csdn.net/qq_41990294/article/details/128931297

版权

最近在看论文，发现一种有趣的通道注意力机制，这里记录一下，方便以查阅。

脑电信号处理——加入通道注意力

方案示例
定义一个可训练的张量
- 理论说明
- 举个栗子
Kaiming initialization
- Xavier初始化
- Kaiming初始化（He初始化）
torch.Tensor的4种乘法
- 点乘
- broadcast
- torch.mul
- torch.mm
- torch.matmul
通道注意力机制
参考资料

方案示例

在这里插入图片描述

定义一个可训练的张量

理论说明

torch.nn.Parameter是继承自torch.Tensor的子类，其主要作用是作为nn.Module中的可训练参数使用。它与torch.Tensor的区别就是nn.Parameter会自动被认为是module的可训练参数，即加入到parameter()这个迭代器中去；而module中非nn.Parameter()的普通tensor是不在parameter中的。

torch.nn.parameter.Parameter(data=None, requires_grad=True)

nn.Parameter可以看作是一个·类型转换函数·，将一个不可训练的类型 Tensor 转换成可以训练的类型 parameter ，并将这个 parameter 绑定到这个module 里面(net.parameter() 中就有这个绑定的 parameter，所以在参数优化的时候可以进行优化)，所以经过类型转换这个变量就变成了模型的一部分，成为了模型中根据训练可以改动的参数。使用这个函数的目的也是想让某些变量在学习的过程中不断的修改其值以达到最优化。

在nn.Module类中，pytorch也是使用nn.Parameter来对每一个module的参数进行初始化的：

在这里插入图片描述

但是如果 nn.Parameter(requires_grad=False) 那么这个参数虽然绑定到模型里了，但是还是不可训练的，只是为了模型完整性这样写。

requires_grad默认值为True，表示可训练，False表示不可训练。

这样写还有一个好处就是，这个参数会随着模型的被移到cuda上，即如果执行过model.cuda(), 那么这个参数也就被移到了cuda上了。

举个栗子

import torch
from torch import nn
 
class MyModule(nn.Module):
    def __init__(self, input_size, output_size):
        super(MyModule, self).__init__()
        self.test = torch.rand(input_size, output_size)
        self.linear = nn.Linear(input_size, output_size)
    def forward(self, x):
        return self.linear(x)
 
model = MyModule(4, 2)
print(list(model.named_parameters()))

在这里插入图片描述

import torch
from torch import nn
 
class MyModule(nn.Module):
    def __init__(self, input_size, output_size):
        super(MyModule, self).__init__()
        self.test = nn.Parameter(torch.rand(input_size, output_size))
        self.linear = nn.Linear(input_size, output_size)
    def forward(self, x):
        return self.linear(x)
 
model = MyModule(4, 2)
print(list(model.named_parameters()))

在这里插入图片描述

也可以在外面，通过register_parameter()注册

import torch
from torch import nn
 
class MyModule(nn.Module):
    def __init__(self, input_size, output_size):
        super(MyModule, self).__init__()
        self.linear = nn.Linear(input_size, output_size)
    def forward(self, x):
        return self.linear(x)
 
model = MyModule(4, 2)
my_test = nn.Parameter(torch.rand(4, 2))
model.register_parameter('test',my_test)
print(list(model.named_parameters()))