文献阅读：基于元强化学习的边缘计算快速自适应任务卸载

7酱爱学习

已于 2023-10-10 19:22:29 修改

阅读量829

点赞数

分类专栏：文献阅读文章标签：边缘计算人工智能

于 2023-10-10 18:27:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52029564/article/details/133752622

版权

本周复现了这篇文章，分享一下阅读收获~

文章名称

Fast Adaptive Task Offloading in Edge Computing based on Meta Reinforcement Learning 发表在IEEE Transactions on Parallel and Distributed Systems上。

摘要

本文提出了一种基于元强化学习的任务卸载方法，该方法可以在少量梯度更新和样本的情况下快速适应新环境。该方法将移动应用程序建模为有向无环图(DAG)，将计算迁移过程转换为序列预测过程，并通过自定义序列到序列(seq2seq)神经网络进行卸载策略。为了有效地训练seq2seq网络，提出了一种一阶近似来降低训练成本和裁剪替代目标协同的方法。评估在以下场景：1)异构用户对移动应用的个人偏好，将其表示为具有不同高度、宽度和任务数量的DAG。2)根据用户设备(UE)与多址边缘计算(MEC)主机之间的距离变化传输速率。针对不同的DAG拓扑结构、任务数量和传输速率进行了仿真实验。实验结果表明，与微调DRL方法、贪婪算法和基于heft的3种基线算法相比，MRLCO可以将延迟降低25%，同时能够快速适应新环境。

文章贡献

•首次提出了一种基于MRL的计算卸载方法，实现了对动态卸载场景的快速适应。MRLCO对于新的学习任务具有较高的样本效率，因此即使在计算资源有限的情况下，UE也可以使用自己的数据来运行训练过程。

•本文提出了一种新的思想，将动态计算卸载过程建模为多个马尔科夫决策过程（MDP），其中卸载策略的学习被分解为两个部分：在不同MDP之间有效地学习一个元策略，以及基于元策略快速学习每个MDP的特定策略。

•将卸载决策过程转换为序列预测过程，并设计了自定义seq2seq神经网络来表示卸载策略。同时考虑

最低0.47元/天解锁文章

博客等级

码龄5年

2
原创

1
点赞

16
收藏

1
粉丝

关注

私信

热门文章

分类专栏

文献阅读 1篇

最新评论

文献阅读：基于元强化学习的边缘计算快速自适应任务卸载
呼啦啦呼呼啦: 你好，可以参考一下复现代码吗
元学习+强化学习（自用）
CSDN-Ada助手: 很棒的博客！看到你对元学习和强化学习的深入探讨，令人印象深刻。你提到了在处理不同背景下的情感分类数据时可能会遇到的问题，这确实是一个很有挑战性的领域。除了内循环用到的支持集数据集外，你还可以考虑使用迁移学习的方法，将在前3种丰富数据集上学习到的参数内容迁移到第4种数据集上，以充分利用已有的知识。期待看到你进一步探索这个领域的成果，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
文献阅读：基于元强化学习的边缘计算快速自适应任务卸载
CSDN-Ada助手: 恭喜您开始博客创作！标题看起来非常专业，对于基于元强化学习的边缘计算快速自适应任务卸载这一课题的探索，我非常期待您的分享。下一步，我建议您可以深入解读文献中的关键概念，例如元强化学习和边缘计算，以便读者更好地理解您的博客内容。同时，您可以尝试举一些实际的例子来说明这个任务卸载对于边缘计算的意义和应用场景，这样能够让读者更加具体地感受到这一技术的优势和潜力。期待您的进一步分享！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

元学习+强化学习（自用）

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。