Beamforming Design for Large-Scale Antenna Arrays Using Deep Learning 学习笔记一

最新推荐文章于 2024-10-13 16:55:28 发布

No_one-_-2022

最新推荐文章于 2024-10-13 16:55:28 发布

阅读量596

点赞数 1

文章标签：深度学习学习笔记

本文链接：https://blog.csdn.net/m0_51143578/article/details/130299915

版权

本文探讨了一种利用神经网络（BFNN）进行毫米波通信的混合波束成形优化方法。文章介绍了Saleh-Valenzuela信道模型，其中包含直达路径和多个非直达路径。BFNN的设计考虑了模拟波束形成器的约束，并通过Lambda层确保恒模条件。损失函数针对无标签数据设计，以最大化平均信道容量。两阶段设计方法首先在离线阶段利用信道样本和SNR估计训练BFNN，然后在线上运行时处理非完美CSI。实验结果显示BFNN对信道估计误差具有一定的鲁棒性。

摘要由CSDN通过智能技术生成

本篇博客还没有完成，主要是论文的研读笔记。

I. INTRODUCTION

II. SYSTEM MODEL

在这篇文章中，一个广泛使用的 Saleh-Valenzuela mmWave channel model 是作为信道模型。有一个 LOS 路径和 $L - 1$ 非 LOS路径

$\mathbf{h}^{H}=\sqrt{\frac{N_{\mathrm{t}}}{L}} \sum_{l=1}^{L} \alpha_{l} \mathbf{a}_{\mathrm{t}}^{H}\left(\phi_{\mathrm{t}}^{l}\right)\tag1$

$\alpha_{l}$ 表示第 $l$ 条通道的复数增益， $\mathbf{a}_{\mathrm{t}}^{H}$ 表示BS处的天线阵列向量， $\phi_{\mathrm{t}}^{l}$ 是第 $l$ 条通道的离开方向的方位角（the azimuth angle of departure）。其中 $l = 1$ 表示 $\mathbf{h}^H$ 的 LOS 分量。

天线阵列响应矢量（Antenna Array Response Vector）通常指由一组天线组成的阵列向某个方向传输电磁波时，在特定频率下，每个天线接收到信号的相对振幅和相位构成的复数矢量。它可以表示为：
$\mathbf{a}(\theta)=\left[1, e^{-j \frac{2 \pi}{\lambda} d \sin \theta}, \cdots, e^{-j(N-1) \frac{2 \pi}{\lambda} d \sin \theta}\right]^{T}$
其中 $θ$ 是到达信号的方向角度， $d$ 是天线间距， $λ$ 是波长， $N$ 是总天线数量。上式中的表达式被称为均匀线性阵列的阵列因子或阵列响应矢量。

在这篇文章中，SE 被选为优化目标
$R=\log _{2}\left(1+\frac{1}{\sigma^{2}}\left\|\mathbf{h}^{H} \mathbf{v}_{\mathrm{RF}} v_{\mathrm{D}}\right\|^{2}\right)\tag2$

$\begin{array}{ll} \underset{\mathbf{v}_{\mathrm{RF}}}{\operatorname{maximize}} & \log _{2}\left(1+\frac{\gamma}{N_{\mathrm{t}}}\left\|\mathbf{h}^{H} \mathbf{v}_{\mathrm{RF}}\right\|^{2}\right) \\ \text { subject to } & \left|\left[\mathbf{v}_{\mathrm{RF}}\right]_{i}\right|^{2}=1, \quad \text { for } i=1, \ldots, N_{\mathrm{t}}, \end{array}\tag3$

III. DL MODEL AND DESIGN OF BFNN

A. Challenges

B. BFNN Architecture

1) Three Specific Considerations:

Input of the BFNN：因为 analog beamformer 是通过模拟电路来实现的，因此无法通过一个全数字神经网络在整个通信链路中优化。因此，BF 被设计产生一个 BF 向量 $\mathbf{v}_{\mathrm{RF}}$ ，根据输入的 the channel estimate $\mathbf{h}_{\text{est}}$ and the SNR estimate $\gamma_{\mathrm{est}}$ 。

全数字神经网络（full-digital NN）是一种可以应用于通信领域的神经网络，它在整个通信链路中进行训练和优化。

Lambda Layer：为了确保最后的 BFNN 网络输出满足恒模条件，一个自定义的的 Lambda 层添加在 BFNN 网络的最后。特别的，这个网络的输入是 $\boldsymbol{\theta}$ ，输入是一个复数

$\mathbf{v}_{\mathrm{RF}}=\exp (j \cdot \boldsymbol{\theta})=\cos (\boldsymbol{\theta})+j \cdot \sin (\boldsymbol{\theta})\tag4$
与另外一种同时生成实部和虚部的策略相比，这种方式以更少的神经元实现了效果，使得网络更加的elegant。作者真的还蛮有意思，哈哈。

Loss Function：不同于传统的监督学习设计，BFNN网络没有标签，我们使用新的 loss function

$\text { Loss }=-\frac{1}{N} \sum_{n=1}^{N} \log _{2}\left(1+\frac{\gamma_{n}}{N_{\mathrm{t}}}\left\|\mathbf{h}_{n}^{H} \mathbf{v}_{\mathrm{RF}, n}\right\|^{2}\right)\tag5$

其中， $N$ 表示总的训练样本数量， $\gamma_n$ ， $\mathbf{h}_n$ 和 $\mathbf{v}_{\mathrm{RF},n}$ 表示 SNR，CSI 和第 n 个样本输出的模拟波束成形器。注意到 loss 函数的降低对应了 average SE 的增加。

2) Two-stage Design Approach:

在 offline 训练阶段中，信道样本，传输的 pilot symbols 和噪声样本是根据 Section II 中的系统模型生成的。

导频符号（pilot symbols）是在通信系统中作为参考信号进行发送和接收的已知信号序列。导频符号的主要作用是用于信道估计和均衡，在正交频分复用（Orthogonal Frequency Division Multiplexing, OFDM）等数字通信技术中广泛应用。

然后，一个实用的毫米波信道估计器被应用于基站，以获取部分CSI。信道估计 $\mathbf{h}_{\mathrm{est}}$ 和 SNR 估计 $\gamma_{\mathrm{est}}$ 被送入到 BFNN 中当作输入。注意到，我们假设 $\gamma_{\mathrm{est}}=\gamma$ 。因为信道样本和信噪比SNR是根据simulation产生的，他们的真实CSI和SNR可以直接被用来计算 loss 函数。通过深度学习网络，BFNN 学会了如何根据估计的信道 CSI， $\mathbf{h}_{\mathrm{est}}$ 达到 perfect CSI 情况下的理想 SE。

在实际通信中，由于各种原因，信道估计存在误差，但通过这种方式，BFNN可以在一定程度上提高对信道估计误差的鲁棒性，并且更加稳健地应对复杂的通信环境。

当线上使用的时候，BFNN的所有参数都固定了，并且训练好的BFNN网络 only 接受非完美的CSI作为输入，并且输出模拟波束形成器（beamformer）。

我们考虑一个 MISO 系统， $N_{\mathrm{t}}=64$ 。 $\mathbf{h}_{\mathrm{est}}$ 的实部和虚部以及 $\gamma_{\mathrm{est}}$ 被连接起来生成一个 $(2N_{\mathrm{t}}+1)\times1$ 的实值输入向量。三个 dense layers 分别有 256，128，64 个神经元。

在机器学习和深度学习中，密集层（Dense Layer）是一种常见的神经网络层，也被称为全连接层。这个层内的所有节点（或神经元）都与前一层中的每个节点都有一个连接，也就是说，每个输入特征都会影响到该层中的每个节点。

各种仿真结果证实，不加任何激活函数的最后一层dense layer有着最好的表现和 convergence behavior。为了有更好的收敛特性，每个全连接层前面都添加了一个 batch normalization 层，在表格中被忽略掉了。在我们的实验中，训练、验证和测试分别有 $10^{5}$ ， $10^{4}$ ， $10^{4}$ 个样本。

$\begin{array}{l} \text { IMPLEMENTATION DETAILS OF THE BFNN. }\\ \begin{array}{c|c|c|c} \hline \text { Layer Name } & \text { Output Dim. } & \text { Activation Func. } & \text { Number of Paras. } \\ \hline \hline \text { Input Layer } & 129 \times 1 &\setminus & 0 \\ \hline \text { Dense Layer 1 } & 256 \times 1 & \text { ReLu } & 33024 \\ \hline \text { Dense Layer 2 } & 128 \times 1 & \text { ReLu } & 32896 \\ \hline \text { Dense Layer 3 } & 64 \times 1 & \setminus& 8256 \\ \hline \text { Lambda Layer } & 64 \times 1 &\setminus & 0 \\ \hline \end{array} \end{array}$

C. Complexity Analysis

大多数基于传统模型的 hybrid beamforming algorithms 通常包括数个iterations，因此不太适用于parallel computing。

IV. SIMULATION RESULTS

$L$ 被设置为 $3$ 。 $\alpha_l$ 满足独立同分布的圆对称零均值高斯随机变量。对于 $l = 1$ ， $\alpha_l$ 的方差被设置为 $1$ ；对于 $l = 2 ， 3$ ， $\alpha_l$ 的方差被设置为 $10^{-0.5}$ 。 $\phi^l_t$ 满足独立的均匀分布在 $[-0.5\pi,0.5\pi]$ 区间之内。两种最新的单个RF链路的 HBF 算法被用作比较，也就是the manifold-optimization based HBF algorithm⁵ and the iterative HBF algorithm 。传统的信道估计算法²被用来获取 $\mathbf{h}_{\mathrm{est}}$ 。学习率被初始化为 0.001，同时还使用了 Adam optimizer。

圆对称复高斯分布的概率密度函数（Probability Density Function, PDF）公式如下：
$f(x)=\frac{1}{\pi \sigma^{2}} \mathrm{e}^{-\frac{|x|^{2}}{\sigma^{2}}}$
其中， $\sigma^2$ 是高斯分布的方差， $x = a + jb$ 是一个复数。