干扰管理学习日志13-------强化学习_功率控制_吞吐量


本文是对论文《Distributed Q-Learning for Aggregated Interference Control in Cognitive Radio Networks》的分析,若需下载原文请依据前方标题搜索,第一作者为Ana Galindo-Serrano and Lorenza Giupponi

一、文章概述

本篇文章中,作者提出了一种基于强化学习的功率控制方案,在超密集蜂窝网络环境下,自适应的调整基站的载波功率值,达到更好地系统吞吐量目的。此外,作者还提出了一种使用深度神经网络拟合强化Q学习的方法,降低了原方案的计算复杂性,最终达到节能的效果。

二、系统环境

在这里插入图片描述
系统环境如上图所示,是一个基站密集部署的蜂窝网络。用户从所连接基站获得信号,同时受到周围其他基站的干扰。

三、算法架构

1.强化学习

(1).输入状态

在这里插入图片描述
输入状态包含三个参量,分别是从用户侧获得的反馈SINR在这里插入图片描述,基站覆盖范围内的用户密度在这里插入图片描述以及个基站状态信息在这里插入图片描述

(2).输出动作

在这里插入图片描述
输出动作为各个基站的功率等级(离散化后的功率等级)。

(3).环境反馈

在这里插入图片描述
环境反馈的由三个部分组成:系统吞吐量、系统能耗以及小区间干扰。

2.深度学习

在这里插入图片描述

(1).网络输入

以整个基站的当前状态S作为输入

(2).网络输出

以基站功率调整方法作为输出

四、性能表征

1.吞吐量

在这里插入图片描述

2.能耗

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

@白圭

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值