【每周论文】Heracles: Improving Resource Efficiency at Scale（ISCA 2015）

最新推荐文章于 2024-04-03 10:00:22 发布

Violet-Guo

最新推荐文章于 2024-04-03 10:00:22 发布

阅读量1.6k

点赞数 1

分类专栏：学术云计算相关会议论文、文章、书籍

本文链接：https://blog.csdn.net/violet_echo_0908/article/details/77823272

版权

Heracles是一种针对数据中心的设计，旨在确保延迟敏感应用（LC）的服务质量，同时最大化最佳努力应用（BE）的吞吐量。通过软件和硬件资源隔离，Heracles实现实时监控和干扰预防，以优化服务器资源利用，降低LC应用的尾延迟违规，同时允许BE应用利用空闲资源。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这篇文章发表在ISCA 2015，其中一作 DAVID LO 2015年毕业于斯坦福大学，是Christos Kozyrakis的学生，毕业之后去了Google的Platforms team，这个工作就是他在Google实习期间做出来的工作。

在数据中心中，为了保护一些面向用户的延迟敏感型应用，例如搜索服务、实时翻译服务、视频网站等应用的服务质量，通常会为其分配过多的资源来保证其性能，这其实是在一定程度上导致了服务器的资源利用率很低。各大公司为了提高自己数据中心的资源利用率，常常将延迟敏感型应用（latency-critical，LC）和其他应用（best-effort，BE）混合运行来提高资源利用率，但是这种方法最大的挑战是，这些应用混合运行之后对于系统的共享资源（如cache、memeory、I/O channels和network links）产生竞争进而对LC应用产生了干扰，对于LC应用来说，在尾延迟（tail latency）方面有非常严格的SLOs（service level objectives），甚至只有一点点的干扰都有可能违反SLO，这样常常导致LC应用的服务质量下降（用户的体验变差）。

作者的目标是消除LC作业的SLO违规，同时最大化BE任务的吞吐量。

为了实现这个目标呢，作者面临了三个挑战：