【论文阅读】Mystic: Predictive Scheduling for GPU Based Cloud Servers Using Machine Learning

7.Mystic: Predictive Scheduling for GPU Based Cloud Servers Using Machine Learning
  • 出处:2016IEEE IPDPS 使用机器学习的基于GPU的云服务器的预测调度

  • 背景:

    • 在同一GPU上共同执行的应用程序之间的资源争用会产生干扰,从而导致性能下降,影响应用程序的QoS要求,降低系统整体吞吐率。现有解决方案要么是为了CPU集群开发的,要么是使用静态分析方法,这可能是计算密集型的,并且不能很好地扩展。
  • 主要工作:提出一个干扰感知调度器Mystic,用于在基于GPU 的集群和云服务器上高效地协同执行应用程序。Mystic识别新应用程序和正在执行的应用程序之间的相似之处,并指导调度器将干扰最小化并提高系统吞吐量。

    • 使用协同过滤来识别新任务和其他正在执行的任务的相似性。协同过滤广泛应用于推荐系统,通过分析用户的购买历史,并根据用户的兴趣提供个性化的推荐。协同过滤中有两种常用方法----基于邻域的方法和潜在因素模型。
    • 争用的影响:多上下文GPU上的资源争用可能导致多个协同执行的应用程序之间的干扰,如流多处理器SMS、内存资源、纹理缓存、全局DRAM和互联网络。
  • 模型:

    • Stage I: 初始化器和配置文件生成器。

      • 初始化程序:查询集群状态表MAST,获取每个计算节点的IP地址、CPU核数、GPU核数和系统内存量,同时为每个传入的应用程序创建状态项。
      • Mysitc为每个传入的应用程序启动连个简短的分析,已获得两个随机选择的COI(干扰的原因:流多处理器SMS、内存资源、纹理缓存、全局DRAM和互联网络。),并存在PIT(概要信息表)中。PIT用PID(进程ID)索引。
      • TRM(评级矩阵):维护离线分析阶段的几个应用程序的完整配置文件。
    • Stage II: 基于协同过滤(CF)的预测

      • CF将PIT和TRM作为输入。首先根据PID返回一个稀疏的PIT向量v(不包含所有COI信息)并附加到TRM上,然后执行基于svd的协同过滤填充TRM中所有缺失的值(只有一行缺少值),补全后将该行添加到PRT(预测表)中。知道调度。
    • Stage III: 干扰感知的调度程序

      以MAST和PRT作为输入,生成应用程序对之间的相似度,决定传入的程序A0是否不会与同一GPU上正在执行的应用程序A1并发执行。首先检查是否有空闲GPU,如果有,则分配到最靠近头节点的GPU,如果没有,获取正在执行的PRT条目,干扰分数并分配到干扰分数最低的GPU。

  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值