论文Meta-Learning for Beam Prediction in a Dual-Band Communication System阅读总结
1)建模
在5G新无线( NR )标准中,BS和UE将分别发射一组预定义的波束来搜索最优波束对,这称为波束扫描。由于sub - 6GHz和mmWave频段具有非常相似的功率方位角谱( PAS ),较为低频的sub-6G频段可以代替毫米波段在波束预测等任务中以减小任务开销。作者提出了一种在sub - 6GHz频段根据信道状态信息( CSI )并输出最优毫米波波束的波束预测方法。
将其建模为根据信道模型的参数h,用深度神经网络从codebook里找到最适合于当前信道的最佳波束f的多分类问题。由于不同基站(BS)的信道条件多变,故采用Meta-Learning的方法先用大量不同的已知BS的训练数据作为不同的任务(Task)离线训练网络模型参数,在部署到未知BS后即可用小样本快速训练出相应模型。
2)作者搭建的网络结构如下:
编码器部分作为一个通用模块,用于跨子任务提取6GHz以下的CSI信息。Feature Embedding特征嵌入,指将编码器提取的特征映射到低维空间中送入解码器。。解码器部分使用余弦距离预测送入的低维特征判断其属于哪一类波束的概率。
3)步骤分为基础训练——meta训练——部署后微调
θe为编码器参数,θd为解码器参数,θ为所有网络参数
基础训练:随机选择已知BS的任务训练,用Adam优化器更新整个网络参数。
———————————————————————————————————————————
Meta训练:外循环即切换任务,更新所有参数;每轮外循环中的内循环是在一个任务内的训练,内循环只更新编码器参数θe同时学习编码器学习率α。
伪代码
1、随机初始化参数θd
2、外循环T轮:
从已知BS中随机选择一个任务
产生相关数据DSspt和DSqry
内循环Gm轮:
通过特征嵌入获得低维特征Espt
通过原型特征平均计算该类的权重向量
按内循环的参数更新公式更新α和θe
通过特征嵌入获得低维特征Etst
按外循环的参数更新公式更新参数θe和θd
———————————————————————————————————————————
部署后的微调训练:θe不变,只微调θd,有了meta-learning的先验知识,即可实现在部署到未知BS上的小样本快速训练,并取得良好效果。
伪代码
遍历未知BS:
从未知BS生成测试的Spt数据集和Qry数据集
加载编码器和解码器参数θ
遍历Ga个轮次:
从编码器获得低维特征Espt
以下式更新参数
从编码器获得低维特征Eqry
预测Etst的最佳波束f
———————————————————————————————————————————
个人思考
在meta训练过程中,基础训练训练出的θd首先就被随机初始化。因为每一轮外循环中的多轮内循环都是在θd不更新的条件下θe随着梯度反向传播更新。但当θd随着外循环更新,在新θd条件下之前训练的θe更新方向可能又会发生改变,因此特别是在训练前期模型收敛速度会很缓慢。
我认为可以不初始化基础训练的θd,观察准确率和模型收敛速度的变化。或者采用一些学习率的tricks,比如在基础训练阶段用warm up,在meta训练阶段采用余弦学习率衰减,这样也有可能改善局部收敛。