Summary of Resource management with deep reinforcement learning 论文笔记

最新推荐文章于 2024-04-07 09:49:16 发布

zhang_yan##

最新推荐文章于 2024-04-07 09:49:16 发布

阅读量300

点赞数 1

分类专栏：机器学习文章标签：人工智能机器学习强化学习深度学习

本文链接：https://blog.csdn.net/qq_42417814/article/details/117180448

版权

Resource management with deep reinforcement learning 论文笔记

现实世界中的资源管理问题是挑战，因为底层系统非常复杂且难以建模，而且输入总是很嘈杂。 Mao et al. 进行的这项研究的目的是回答强化学习是否可以提供一种可行的替代方法，以替代人为诱发的启发式资源管理。简而言之：系统可以学习自己管理资源吗？

深度强化学习将神经网络建模与传统的RL算法结合使用，可以通过与可以在面对特定状态时获得最大收益的环境进行交互，学习根据经验做出更好的决策。作者认为，深度RL方法适用于资源管理系统。原因如下。首先，系统做出的高度重复的决策会创建大量的训练数据。其次，由于神经网络可以逼近值函数并因此减少内存资源，因此Deep RL可以对涉及高维状态空间的非常复杂的系统进行建模。第三，RL可以针对难以直接优化的目标进行培训。最后，RL代理可以通过不断学习问题来针对特定的工作负载进行优化。

作者用集群资源的当前分配和等待被调度为映像的作业的配置文件来表示状态空间（示例如图所示）。群集图像（图中最左侧的图像）显示了当前正在处理的作业以及处理这些作业所需的CPU数量，其中不同的颜色代表不同的作业。群集图像从当前时间步开始，并在未来的T时间步之前向前看。作业插槽图像（图中的蓝色图像）表示特定作业所需的CPU数量以及该作业将花费的时间。
作者仅保留要服务的前M个作业的图像，但保留一些可用资源，以便可以快速安排在不久的将来到达的小型作业（“积压（backlog）”，作者将其设置为60个作业）。

在这里插入图片描述