【论文阅读】基于鲁棒强化学习的无人机能量采集可重构智能表面

最新推荐文章于 2024-06-28 14:30:49 发布

各可

最新推荐文章于 2024-06-28 14:30:49 发布

阅读量1.2k

点赞数 4

分类专栏： # ~边缘计算~ 文章标签：论文阅读无人机边缘计算强化学习智能反射面

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43996701/article/details/130734827

版权

~边缘计算~ 专栏收录该内容

4 篇文章 1 订阅

订阅专栏

只做学习记录，侵删原文链接

@article{peng2023energy,
title={Energy Harvesting Reconfigurable Intelligent Surface for UAV Based on Robust Deep Reinforcement Learning},
author={Peng, Haoran and Wang, Li-Chun},
journal={IEEE Transactions on Wireless Communications},
year={2023},
publisher={IEEE}
}

《Energy Harvesting Reconfigurable Intelligent Surface for UAV Based on Robust Deep Reinforcement Learning》基于鲁棒强化学习的无人机能量采集可重构智能表面 IEEE Transactions on Wireless Communications一区

论文背景

研究目标

RIS每一个反射单元都由无源器件电容、电阻等构成，能耗小、成本低，能单独对信号进行反射。
UAV在动态密集的户外活动，如马拉松、音乐会等，提供按需通信服务有巨大潜力。
- 缺点：
RIS：静态部署，当服务覆盖范围中只有少量用户终端（UT）时，使用所有反射阵列进行信号传输可能导致资源浪费。
UAV：临时基站（BS）、辅助物联网（IoT），增强热点覆盖，但电池容量限制。
- 目标：这项工作是使无人机和智能反射面结合，旨在在有限的时间范围内最大限度地提高UAV–RIS的总能量收集效率，同时满足用户所需的最小吞吐量约束

系统模型

在这里插入图片描述

两个维度
1. 只考虑时间：分为两个阶段
  （1）能量传输阶段（2）信号传递阶段
2. 考虑时间和空间
  （1）能量传输阶段（2）信号传递阶段：在该阶段还考虑智能反射面哪些反射元件用于能量收集。

通信模型

在这里插入图片描述

优化函数

下图中只写出了时空两个维度的，单一时间维度的类似。
在这里插入图片描述

算法设计

本文使用到强化学习的SD3算法，该算法是TD3算法的优化（求Q值引入Softmax），下图对比了TD3算法和DDPG算法，并简单列出了SD3算法的推导过程。
在这里插入图片描述

TD3改善DDPG高估的问题。
SD3算法改善TD3算法的低估问题。推导过程如下（其中为便于计算机求解原算法将积分问题使用了重要性采样）：
马尔科夫元组个元素。

实验部分不在此是赘述，感兴趣可以阅读原文。

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
【论文阅读】基于鲁棒强化学习的无人机能量采集可重构智能表面

该论文使无人机和智能反射面结合，旨在在有限的时间范围内最大限度地提高UAV–RIS的总能量收集效率，同时满足用户所需的最小吞吐量约束。
复制链接

扫一扫

专栏目录

博客等级

码龄6年

71
原创

104
点赞

221
收藏

363
粉丝

关注

私信

热门文章

分类专栏

最新评论

pycharm用ssh连接远程服务器（高级tips）
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
关于我的Mobaxterm出现企鹅这件事
各可: 目前没有发现
关于我的Mobaxterm出现企鹅这件事
2301_78598318: 那个小企鹅可以换别的样式么
操作系统OS 中断和陷入的联系与区别
m0_73214772: 操作系统陷入（OS trap）是指当操作系统检测到发生了某些特定的错误或异常情况时，会触发一个中断或异常，将控制权交给操作系统内核来处理这个错误或异常。这种情况通常发生在用户程序执行过程中，例如访问非法内存、执行非法指令、除零错误等。操作系统会捕获这些异常情况并采取相应的措施来处理，例如终止程序、显示错误信息、恢复系统状态等。操作系统陷入是操作系统保证系统稳定性和安全性的重要机制之一。
Vscode运行c++的openmp并行问题
三点水、: omp_get_thread_num()总是返回0是为啥呢，我的电脑是8核16线程的呀

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

各可 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。