读--Joint Request Mapping and Response Routing for Geo-distributed Cloud Services_b.joint request mapping and response routing for g-CSDN博客

本文链接：https://blog.csdn.net/u014295667/article/details/47001091

本篇论文，发表在ccf推荐的a类会议，infocom上。

本篇主要研究的是，在分布式云中，综合考虑请求映射和响应路由，来对其性能performance进行优化。即如何合理实现请求的映射和响应路由的设计，来提高整个分布式云平台的性能，其中包括时延、电力花费和带宽花费。

文章主要的贡献在于：
1、综合考虑请求映射和响应路由，设计了一个通用的计算公式，其中考虑了综合用电量和带宽花费在地理上的差异。章节2
2、基于ADMM算法设计了一个分布式算法，来解决大规模数据的优化问题。章节3
3、利用Wikipedia workload traces的数据对算法进行了经验评估。章节4

文章的第2章节主要介绍了框架 a framework for joint mapping and routing。
A infrastructure
符号说明：
1、服务商有 N 个数据中心datacenters，每个datacenter n 归属于一组ISP连接 Mn ，并且每个都有一个固定的功能。
2、I 表示一组客户端 clients。client i 是一个独一无二的 IP prefix。
3、αij 取值在[0,1]之间. 表示来自客户端client i的请求是否分配给 stub datacenter j 处理。
4、Di：traffic demand of each client
5、这里写图片描述：stub datacenter j 的电力价格
6、：带宽价格

架构假设：
1、mapping node来负责client requests 到 an appropriate datacenter 的映射。其中mapping node 可以是DNS服务器，也可以是HTTP代理服务器。假设 mapping node 能够面向所有数据中心datacenters 任意划分客户端的请求流量 request traffic。

2、当数据中心处理完请求后，需要通过一条有效的ISP链路将响应包 response packets 发送给client。事实上，一个BGP路由为每个IP prefix选择一个单一的ISP链路出口。这里作者放宽约束条件，允许服务商能够面向所有ISP链路ISP links 随意划分相应流量 response traffic。可以通过基于哈希的流量划分（hash-based traffic splitting）实现。

3、将datacenter和ISP link的所有可能结合起来作为：“a virtual stub datacenter”。用如下公式表示:
” j ×J,J := N ×{M n} “。每个stub datacenter都有一个有限的能力 Cj，这个取决于它的 ISP link能力。这里合理假设 ISP link能力相对于数据中心的计算能力，是服务提供和响应的瓶颈。

4、由上可以得出，结合请求映射和响应路由可以看作是clients 与 stub datacenters 之间的工作量管理优化问题，即workload management optimization。

5、提供商要定期计算工作量管理结果去更好地解决正常操作下的动态请求流量 dynamic request traffic。 “αij × [0, 1]”表示client i 的请求分发给 stub datacenter j 的比例。这里是指客户端的请求并不是只被一个datacenter处理，而是被整个数据中心datacenters分布式处理。这里假设在进行优化值求解之前，应用统计学的机器学习技术去预测每个client Di 的流量需求 traffic demand。
Di：traffic demand of each client

B performance
时延作为衡量指标，the end-to-end propagation latency between users and datacenters。
假设：服务商能够通过有效的方法获取传播时延，between client i and datacenter j，即Lij。
这里引入一个效用函数 utility functions, U。要求U是一个递减的，可区分的，凹函数（concave function）。
性能的表示：这里写图片描述
即，通过一个常用的效用函数U，求解出client 请求被接受的平均传播时延。

C costs
这里考虑消费从两个角度进行考虑，电力消费（electricity）、带宽消费（bandwidth）。
电力消费：首先有着明显的区域差异性，
带宽消费：影响因素有：对应的ISP，地区差异。
假设：带宽与流量大小成线性关系。

D 建模

这里写图片描述

(1)为目标函数，找到cost 和 performance的平衡点，分为三个部分介绍，@1，@2，@3。

@1：αij（PE+PB）,表示client i 单位流量的一个请求的cost的期望值。总的式子表示，client i
Di大小的请求的总花费cost。
@2：∑αij*Lij，表示client i
单位流量的一个请求的时延latency的期望值，上文提到利用效用函数U对时延latency进行合理的转化，这里可以理解为将时延（性能的衡量标准）转化成收益，实际生活中，时延越小，收益越大。（这里也可以理解上文提到的U是递减的，可区分的的凹函数，类似于log的，最后无限趋近于横坐标）。
@3：@1-@2，表示花费-收益 = 总的剩余花费。而min则表穷尽所有α可能的取值（也就是mapping映射可能），所得到的最小的花费，即为本模型的目标函数。

（2）是工作量守恒。client的请求被完整处理

（3）防止stub datacenter的ISP链路溢出，所有客户端总的请求<=数据中心的处理能力