Attention Model for Massive MIMO CSI Compression Feedback and Recovery阅读笔记-CSDN博客

本文链接：https://blog.csdn.net/weixin_43540533/article/details/120289068

Abstract

本文旨在提高恢复性能，降低时间复杂度。首先在编码器网络中，引入LSTM网络；解码器中增加了注意力机制；第三，在训练过程中使用了early stopping。

1 Introduction

在CsiNet的基础上，做了以下几点改进：

在编码器部分，引入LSTM网络来代替原来的全连接网络。当压缩比CR很高时，LSTM网络可以充分利用信道矩阵之间的相关性并保留重要信息。
受SEnet的启发，在CNN中引入注意力机制。模型可以充分利用CNN的特征图。我们的model称为Attention-CsiNet
采用early stopping来阻止过拟合。可以更快收敛节省大量时间。

2 System Model

单小区FDD下行链路大规模MIMO-OFDM系统中，考虑 $N_c$ 个子载波。在BS端采用 $N_t >> 1$ 的ULA天线，UE端单个天线。UE端第 $i_{th}$ 子载波表示为：

$y_i = \textbf{h}_i \textbf{v}_i x_i + n_i$

用 $\textbf {H}_D = [\textbf{h}_1, \textbf{h}_2,...,\textbf{h}_{N_c}]$ 表示空频域的CSI矩阵。在FDD链路中，UE需要估计 $\textbf{H}_d$ 然后将CSI通过反馈链路送回BS端来追踪时变信道特征。一旦BS接收到CSI反馈，他就可以设计预编码向量，调制方式和码率。

通过2D-DFT将 $\textbf {H}_d$ 变换到角延迟域来观察。得到近似稀疏矩阵 $\textbf{H}_s$

$\textbf {H}_s = \textbf{F}_d\textbf{H}_d\textbf{F}_a$

因为有限的多径延迟，所以可以系数化。只有 $\textbf{H}_s$ 的前 $\tilde N_c(<< N_c)$ 包含非零元素，然后移除其余 $(N_c-\tilde N_c)$ 行。

编码器网络 $\textbf{H}_{en}=f_{LSTM}(\textbf{H})$ ，解码器网络 $\hat {\textbf{H}} = f_{CNN}(\textbf{H}_{en})$

3 The proposed Attention Model

尽管CsiNet在感知和重建方面表现了出色的性能，但发现仍有改进的余地。

A. LSTM encoder

CsiNet忽略了子载波之间的相关性。受RNN在NLP领域的启发的启发，能够从序列任务中提取信息。所以使用LSTM网络来代替全连接来提高恢复质量。

在这里插入图片描述

我们使用双向LSTM（bi-LSTM）获得M维向量结果，并找到两个向量的平均值作为反馈的编码向量。LSTM网络共享相同的参数。

如图上图所示，我们reshape $\textbf H$ to $[\textbf h_1, \textbf h_2,...,\textbf h_s]$ 同时将 $s$ vectors送入bi-LSTM network。 $s$ 也是LSTM网络的时间步长。最终得到一个 $M$ 维的向量作为最终的编码CSI向量进行反馈。

B. Attention Mechanism

在CNN中加入SEblock。

在这里插入图片描述

C. THE Structure of Attention Csi-Net

在这里插入图片描述

整体架构如图所示：

将CSI矩阵H的实部和虚部作为网络输入的两个通道。第一层是卷积层，其尺寸为3×3个核，批量标准化[15]层可以加速训练并防止过度拟合。该层将生成两个feature maps。然后将特征 reshape成 $s$ vectors，送入到bi-LSTM神经网络中来生成code $\textbf H_{en}$ ，一个 $M$ 维向量。

一旦在BS中获得了码字，我们使用LSTM解码器网络来重建最初的信息。我们重复 $\textbf H_{en}$ s次，然后将这些向量送入到LSTM网络去基本恢复 $\textbf H$ 。将LSTM的输出reshape成$2\times N_t\times N_t的矩阵。然后该矩阵被送入两个RefineNet模块，以便完全重构CSI矩阵。