【论文阅读】Mystic: Predictive Scheduling for GPU Based Cloud Servers Using Machine Learning

最新推荐文章于 2024-07-26 13:24:37 发布

牛码当驴

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量457

点赞数 5

分类专栏：论文阅读云计算文章标签：论文阅读机器学习人工智能云计算

本文链接：https://blog.csdn.net/weixin_46091520/article/details/136699382

版权

云计算同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

论文阅读

6 篇文章 0 订阅

订阅专栏

7.Mystic: Predictive Scheduling for GPU Based Cloud Servers Using Machine Learning

出处：2016IEEE IPDPS 使用机器学习的基于GPU的云服务器的预测调度
背景：
- 在同一GPU上共同执行的应用程序之间的资源争用会产生干扰，从而导致性能下降，影响应用程序的QoS要求，降低系统整体吞吐率。现有解决方案要么是为了CPU集群开发的，要么是使用静态分析方法，这可能是计算密集型的，并且不能很好地扩展。
主要工作：提出一个干扰感知调度器Mystic，用于在基于GPU 的集群和云服务器上高效地协同执行应用程序。Mystic识别新应用程序和正在执行的应用程序之间的相似之处，并指导调度器将干扰最小化并提高系统吞吐量。
- 使用协同过滤来识别新任务和其他正在执行的任务的相似性。协同过滤广泛应用于推荐系统，通过分析用户的购买历史，并根据用户的兴趣提供个性化的推荐。协同过滤中有两种常用方法----基于邻域的方法和潜在因素模型。
- 争用的影响：多上下文GPU上的资源争用可能导致多个协同执行的应用程序之间的干扰，如流多处理器SMS、内存资源、纹理缓存、全局DRAM和互联网络。
模型：
- Stage I: 初始化器和配置文件生成器。
  - 初始化程序：查询集群状态表MAST，获取每个计算节点的IP地址、CPU核数、GPU核数和系统内存量，同时为每个传入的应用程序创建状态项。
  - Mysitc为每个传入的应用程序启动连个简短的分析，已获得两个随机选择的COI(干扰的原因：流多处理器SMS、内存资源、纹理缓存、全局DRAM和互联网络。)，并存在PIT(概要信息表)中。PIT用PID(进程ID)索引。
  - TRM(评级矩阵)：维护离线分析阶段的几个应用程序的完整配置文件。
- Stage II: 基于协同过滤(CF)的预测
  - CF将PIT和TRM作为输入。首先根据PID返回一个稀疏的PIT向量v(不包含所有COI信息)并附加到TRM上，然后执行基于svd的协同过滤填充TRM中所有缺失的值(只有一行缺少值),补全后将该行添加到PRT(预测表)中。知道调度。
- Stage III: 干扰感知的调度程序
  
  以MAST和PRT作为输入，生成应用程序对之间的相似度，决定传入的程序A0是否不会与同一GPU上正在执行的应用程序A1并发执行。首先检查是否有空闲GPU，如果有，则分配到最靠近头节点的GPU，如果没有，获取正在执行的PRT条目，干扰分数并分配到干扰分数最低的GPU。

牛码当驴

关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
【论文阅读】Mystic: Predictive Scheduling for GPU Based Cloud Servers Using Machine Learning

提出一个干扰感知调度器Mystic，用于在基于GPU 的集群和云服务器上高效地协同执行应用程序。Mystic识别新应用程序和正在执行的应用程序之间的相似之处，并指导调度器将干扰最小化并提高系统吞吐量。
复制链接

扫一扫

专栏目录