2020-12-10

[车联网资源分配学习笔记]

2020年12月7日- 12月13日
论文一

1、论文题目
《A Latency and Reliability Guaranteed Resource Allocation Scheme for LTE V2V
Communication Systems》

2、作者及所在实验室或学校等
Jie Mei Nanjing University

3、发表的期刊, 发表的时间, 期刊水平
IEEE TRANSACTIONS ON WIRELESS COMMUNICATIONS, VOL. 17, NO. 6, JUNE 2018一区

4、论文解决的主要问题
数学分析方法解决城市交通场景下的车联网资源分配问题,联合优化RB调度、功率分配和MCS
优化目标是最大化最小SINR阈值。

5、论文的主要贡献及创新点
1)、利用随机网络计算中的最大加排队方法(the max-plus queuing approach),建立了一个合适的模型来描述分组延迟,然后将V2V通信的延迟要求转化为数据速率约束,即应向VUE分配最小的资源量,以保证其分组延迟要求
2)、 将拉格朗日对偶分解法和二元搜索法相结合,将所考虑的问题分为独立子问题,具有封闭形式的解。 为了进一步降低计算复杂度,提出了一种迭代资源管理算法

6、论文使用的主要方法

1)、数学方法总结:
a、拉格朗日对偶分解方法
某些条件下,把原始的约束问题通过拉格朗日函数转化为无约束问题,如果原始问题求解棘手,在满足连续可微分的条件下用求解对偶问题来代替求解原始问题,使得问题求解更加容易
b、二分搜索方法:
用来最大限度地提高(受VUE 的BLER和分组延迟要求以及发射功率约束的CUES之间的最小SINR
c、最大加队列方法:
将延迟限制公式(8)转化为数据速率约束
d、Lambert W 函数

计算最小传输速率Rmin
2)、系统模型
SINR of the k-th VUE’s corresponding receiver in the i-th RB:

BLER(块错误率):
(SINR threshold γl
are MCS-dependent)
Throughput:

l表示选择的MCS种类
data rate:

uplink SINR of the i-th CUE:

3)、Packet Latency Model
the latency of the n-th packet in the k-th VUE’s buffer:

W是缓冲区中等待时间,δk(n)是传输时间
latency outage probability requirement of V2V communication can be expressed as:

4)、Problem Formulation

5)、利用最大加队列方法,将延迟限制公式(8)转化为数据速率约束

再利用Lambert W function 计算Rk min
以此将问题(9)转化为(13):

解决(13)分为两步:
一、先用再用dual function of Lagrange function 获得 fifixed Φ;
二、再用二分搜查方法获得the maximum value of φt
迭代更新拉格朗日乘子,最终得到最优解

论文二
1、论文题目
《A Deep Learning Based Resource Allocation Scheme in Vehicular Communication Systems》

2、作者及所在实验室或学校等
Mimi Chen† , Jiajun Chen† , Xiaojing Chen† , Shunqing Zhang† and Shugong Xu†
† Shanghai Institute for Advanced Communication and Data Science,
Key laboratory of Specialty Fiber Optics and Optical Access Networks,
Joint International Research Laboratory of Specialty Fiber Optics and Advanced Communication,
Shanghai University, Shanghai, 200444, China

3、发表的期刊, 发表的时间, 期刊水平
2019 IEEE Wireless Communications and Networking Conference (WCNC)

4、论文解决的主要问题
本文提出了混合V2V和V2I通信的联合频谱复用和功率分配问题。 认识到V2I和V2V链路的高容量和低延迟要求。优化目标是最大限度地提高容量和延迟要求的加权和。 通过将原始问题分解为分类子问题和回归子问题,开发了一种基于卷积神经网络(CNN)的方法,以获得关于频谱重用和功率分配的实时决策。

5、论文的主要贡献及创新点
1)、将资源分配任务制定为一个联合频谱重用和功率分配问题。 认识到V2V链路的严格延迟要求,我们最大限度地提高了车辆通信的容量和延迟要求的加权和。
2)、用CNN第一次将车辆通信的原始问题分解为分类子问题和回归子问题,以推断联合频谱重用和功率分配的最优决策
3)、所提出的CNN可以获得与Exhaustive method相似的性能,同时大大减少了计算时间。 低复杂度使得所提出的方法非常适合于车辆通信的高速移动场景

6、论文使用的主要方法

1)、系统模型
在mthC-UE和BS之间的信道功率增益hm,b:

g是小尺度衰落系数,a是大尺度衰落功率分量由路径损耗和阴影组成

γcm 和γvd分别表示BS和dthV-UE接收机接收到SINR:

Cm和Cs表示mthC-UE和sthV-UE发射机的遍历能力(它们是由快速衰落 上的长期平均值计算的):

延迟要求可以表示为:

其中Css是最小遍历容量,R是传输数据速率

本文的目标是最大限度地利用V2I和V2V链路的遍历容量和V2V链路的延迟要求,对频谱重用ρm、s和功率分配{Pcm,Ps v}作出最优决策}。 资源配置问题可制定为:

这是一个高度非线性的非凸优化问题,通常很难解决。为此提出了一种基于CNN的方法来解决这个问题。
2)CNN网络

a)输入层:穷举方法迭代计算和比较(7a)中所有可能方案的目标,并选择最大目标的方案之一作为最优解,通过这样做,穷举方法为提出的基于CNN的方法设置了一个基准,计算成本很高。 通过多次重复上述过程,生成整个训练数据集{h,ρm,s,Pcm,Psv,∀m,d,s}
b)隐藏层:由三个卷积层和三个具有激活函数(即恢复线性单元(RelU))的完全连接(FC)层组成
c)输出层:该层获得三个输出。 一是矩阵A指示频谱重用的类索引,它是多标签分类子问题的解决方案。 选择softmax作为激活函数。 另外两个输出分别是V2I和V2V链路的发射功率,Pcm和Psv。 它们是回归子问题的输出,选择RelU作为激活函数。
d)损失函数:
Mean Squared Error (MSE)均方误差,用于回归问题

Categorical Crossentropy范畴交叉熵,用于分类问题

ρ˜j是CNN输出的频谱复用预测类指标,ρj是频谱复用的目标类指标

对CNN进行训练,使以下总损失函数最小化:

论文三

1、论文题目
《Learn to Compress CSI and Allocate Resources in Vehicular Networks》

2、作者及所在实验室或学校等
Liang Wang , Member, IEEE, Hao Ye , Student Member, IEEE, Le Liang , Member, IEEE,
and Geoffrey Ye Li, Fellow, IEEE
Geoffrey Ye Li (Fellow, IEEE) was with AT&T Labs—Research at Red Bank, NJ, USA

3、发表的期刊, 发表的时间, 期刊水平
IEEE TRANSACTIONS ON COMMUNICATIONS, VOL. 68, NO. 6, JUNE 2020

4、论文解决的主要问题
优化了频谱共享性能;同时使用深度神经网络压缩观测到的信息,降低了高动态V2X网络中的网络信令开销。

5、论文的主要贡献及创新点
1)利用DNN和RL,为车辆频谱共享设计了一个集中决策和分布式实现体系结构,最大限度地提高了所有车辆的 long-term sum rate
2)用每个车辆上的DNN来压缩局部观测,再由量化层(最后转化成一个二进制数)进一步增强,以减少网络信令开销
3)开发了一种分布式决策体系结构,允许在每个车辆上本地进行频谱共享决策,并设计了用于减少信令开销的二进制反馈

6、论文使用的主要方法
1)系统模型
本文中为了提高频谱利用率,所有V2V链路都与V2I链路共享频谱资源。 因此,N是V2I links数目,也是信道集。

接收到的V2I链路的信噪比SINR:

第n通道上的第n个V2I链路的容量:

第n通道上的k-V2V链路的SINR:

其中,是其他V2V链路在第n信道上造成的的干扰,是V2I链路在第n信道上造成的干扰。
第n通道上的k-V2V链路的容量:

3)基于BS决策的频谱共享体系结构

在这一部分中,设计了每个V2V链路的DNN体系结构和分别用于BS集中控制的DQN。 然后,提出了集中式决策和分布式频谱共享体系结构,称为C决策方案。 最后介绍了信息压缩的二进制反馈设计。
A)V2V DNN Design
k-V2V的观测值:

其中包括信道增益、所有干扰功率、发射功率、从第k-V2V链路到所有V2I链路的交叉信道增益
在每个V2V链路上使用DNN压缩局部观测。 压缩信息bk是DNN的输出,在BS时反馈给DQN,作为DQN的输入。

B). Deep Q-Network at the BS
BS将所有学习到的反馈视为代理环境的当前状态,可以表示为

然后BS确定每个V2V链路的信道指示器ρk[n]的值。 这就是所需要的动作,因此,将BS的动作a定义为

BS的奖励表示为:

其中,表示第n个V2I链路在第n个信道上的容量;表示第k-V2V在所有通道上的容量。
RL问题的求解与策略π(a,s)的概念有关,使用Q学习方法:

用e-greedy算法更新A:

C)Centralized Control and Distributed Transmission Architecture(C-Decision scheme)
每个V2V链路首先观察其局部环境,然后采用DNN将观察到的信息压缩成几个实数,最后反馈给BS进行集中决策。 该BS以所有V2V链路的反馈信息作为输入,利用DQN执行Q学习来决定所有V2V链路的信道分配,并广播其决策。 最后,每个V2V链路选择BS分配的信道进行传输。
BS DQN的更新过程可以写成:

D) Spectrum Sharing With Binary Feedback
为了进一步减少反馈开销,本文提出了一个将V2V链路的实值反馈量化为几个二进制数字的框架。
二进制量化过程包括两个步骤:1、在连续区间[-1,1]中生成所需的连续反馈值 2、第二步以第一步的输出作为其输入,为第一步的每个输出实值中产生所需的离散反馈数。
其中,第一步中用了tanh激活函数,第二步用了符号函数。
为了解决符号函数梯度不连续的问题,将一二步骤结合起来将完整的二进制反馈函数表示为:

其,W0和B0分别表示将激活从神经网络中的前一层转换的预二元层的线性权重和偏差。

4)DISTRIBUTED DECISION MAKING AND SPECTRUM SHARING ARCHITECTUR分布式决策和频谱共享体系结构(D-Decision scheme)

为了进一步促进分布式频谱共享,降低计算复杂度,提出了分布式决策和频谱共享体系结构(命名为D-决策方案),让每个V2V链路做出自己的频谱共享决策。 在这一部分中,首先设计了每个V2V链路的神经网络体系结构,分别压缩CSI并做出决策,然后设计了BS的神经网络来聚合来自所有V2V链路的反馈。 然后,提出了混合信息聚合和分布式控制体系结构。 最后,提出了具有二进制聚合信息的D-决策方案。
A.DNN Design at V2V and BS
每个V2V包含:一个压缩DNN,来压缩本地观测以获得反馈;另一个决策DQN,用于分布式频谱共享决策。
BS通过其DNN(称为聚合DNN)聚合来自所有V2V的反馈,然后广播聚合信息(AGI)φ给所有V2V。 最后,每个V2V结合其局部观测和AGI作为其决策DQN的输入,以决定传输哪个信道。
B.Hybrid Information Aggregation and Distributed Control Architectur混合信息聚合和分布式控制架构
C.Distributed Spectrum Sharing With Binary Information分布式频谱共享与二进制信息
和集中式部分类似

7、对这个论文的看法、借鉴的地方:
1)本文里DNN和DQN是联合训练的,这样训练复杂度很高。可以分别训练DNN和DQN,以减轻训练过程中的开销。 但是不清楚优化两个网络的端到端系统性能的适当培训目标是什么。
2)集中决策和分布式实现是两种不同的思路,本文里将两者结合发挥各自优点
3)压缩观测值、二进制策略都能有效减小信令开销

下周任务:

1、总结看过的Hao Ye、Geoffrey Ye Li团队的四篇论文,联系起来,然后根据代码学习他们的建模和求解过程
2、Q学习、MDP部分看得再深入一点
3、再读论文的时候加上自己的思考,提取可以用的算法、想法,并寻找别人作法里的不足之处
4、读论文的时候,关注时间,多了解最新的方法

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值