[论文阅读笔记]Aladdin: Optimized Maximum Flow Management for Shared Production Clusters
摘要诸如深度学习和对延迟敏感的在线Web服务之类的长期应用程序(LLA)的普及,为共享生产环境中的集群调度程序带来了新的挑战。对LLA进行调度需要支持复杂的放置约束(例如,在不同的计算机上运行一个应用程序的多个容器)和更大的并行度以提供全局优化。但是现有的调度程序通常会遇到严重的约束违规,高延迟和低资源利用率的问题。本文提出Aladdin,它是一种新颖的集群调度程序,它可以在避免约束冲突的同时最大程度地提高资源效率:(i)提出了多维非线性性能函数*( multidimensional and nonli
原创
2020-11-12 16:04:22 ·
404 阅读 ·
2 评论