[A类多层应用排队论]Stochastic Resource Provisioning for Containerized Multi-Tier Web Services in Cloud

最新推荐文章于 2024-07-15 11:54:34 发布

千灵域

最新推荐文章于 2024-07-15 11:54:34 发布

阅读量196

点赞数 1

分类专栏：计算机论文排队论文章标签：排队论云计算弹性调度

本文链接：https://blog.csdn.net/u012837895/article/details/108608140

版权

计算机论文同时被 2 个专栏收录

12 篇文章 1 订阅

订阅专栏

排队论

6 篇文章 0 订阅

订阅专栏

Stochastic Resource Provisioning for Containerized Multi-Tier Web Services in Cloud

IEEE Transactions on Parallel and Distributed Systems,2017. CCF A类

Docker背景下构建的多层应用，运用G/G/n进行建模并且使用随机过程来解决非线性最优化问题。

背景

不能在变化的流量中适当地分配资源是导致响应时间延迟和资源浪费的重要因素。而响应时间的延迟会造成商业软件明显的损失，比如100ms的延迟会导致亚马逊损失1%的销售额，Google在遇到500ms的延迟时会损失20%的流量。

流量与CPU占用率的映射

尽管流量与CPU占用率之间的关系是非线性且变化的，它可以在每个时刻被描述出来。给定一个独立的容器集合S，流量数 $\lambda_i$ 在容器i( $i\in S$ )产生的CPU占用率 $u_i$ 在时间间隔t上可以表述为以下形式（引用：Z. Abbasi等 Thermal aware server provisioning and workload distribution for internet data centers./ Proc. ACM INt. Symp. High Perform. Distrib. Comput., 2010,pp.130-141）

$\lambda_{i,t} = \Lambda \cdot u_{i,t}$

其中quantity $\Lambda$ 被定义为一个peak workload与相关的peak CPU utilization的比例，在仅有一个容器i接受流量且其资源耗尽时。如此我们可以改写上式为

$\lambda_{i,t} = \frac{\lambda^{peak}}{u^{peak}}u_{i,t}$

quantity $\Lambda$ 的测量方法为在测试环境中构建一个只有容器i的层，并加流量到saturation。

排队现象描述

参考文献：

J. Leverich等 Reconciling high server utilization and sub-milisecond quality-of-service. Proc. Eur. Conf Comput. Syst. 2014, Art. no.4
J.Li等 Tales of the tail: Hardware, OS and application-level source of tail latency. Proc. ACM Symp. Cloud Comput., 2014, 1-14.

上述文献指出了一个现象，即如原图5所示，在高度负载的情况下，资源占用率与QoS高度相关。

我个人的理解是这样的。随着流量增大，有两种情况，一种是较小的时候，此时随着进入流量的增加，CPU占用率会逐渐增大，但响应时间会基本保持不变；此时服务会不断增加线程占用CPU，但是服务的并发能力没有达到上限。流量进一步增加就会到达第二个阶段，此时随着入口流量的增加，CPU占用率会变得相对平稳，但是响应时间会快速增加，此时服务的并发能力已经耗尽，因此会出现排队，也就是原文所提到的queueing delay。

同时，流量的种类（感觉作者的意思指的是流量的组成，即平均而言单个流量带来的资源需求是不同的）也会对CPU占用率产生直接影响。

建模

首先将网络请求描述为一个时间序列，我们认为一个时间序列可以被定义为一组随机变量，令 $X_t$ 作为一个随机变量打死表一个固定长度为l的时间点t中所含有的所有请求数。如此，可以得到一组数据 $\{\lambda_t t:\in [1,T] \}$ 来描述T*l时间内的访问量。

我们将上述集合作为一个随机过程，并将每一个观测值 $\lambda_t$ 作为一个realization of the stochastic process。

作者使用了G/G/m排队系统来捕捉每一层的行为，对其进行建模。服务的到来时间与服务时间都服从一个随机的固定分布，且遵循FIFO的服务状况，长度为无限。

系统的请求到达速率为 $\lambda$ ，请求处理速率为 $\mu$ ，则到达的间隔时间的期望显然为 $1/\lambda$ 。

对于m台服务器，有 $\lambda < m\mu$ ，或者根据Little’s law，等价的有$\rho=\frac{R}{m}<1 $ s.t. $R=\frac{\lambda}{\mu}$ ，其中 $\rho$ 是utilization factor，R是offered load，系统说是会处于稳定状态。

后面这部分过程略过，因为G/G/m是没有详细分析公式的，所以作者是使用 $\rho \to 1$ 的情况下G/G/1的公式分析与M/M/n来进行近似。

最后是得到了一系列的约束条件，然后求解一个两步的随机最优化模型来取得最佳的实例数量。

千灵域

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[A类多层应用排队论]Stochastic Resource Provisioning for Containerized Multi-Tier Web Services in Cloud

Stochastic Resource Provisioning for Containerized Multi-Tier Web Services in CloudIEEE Transactions on Parallel and Distributed Systems,2017. CCF A类Docker背景下构建的多层应用，运用G/G/n进行建模并且使用随机过程来解决非线性最优化问题。背景不能在变化的流量中适当地分配资源是导致响应时间延迟和资源浪费的重要因素。而响应时间的延迟会造成商业软件明显
复制链接

扫一扫