Multipath TCP(MPTCP) Congestion Control抛砖引玉

最新推荐文章于 2024-07-31 08:46:57 发布

dog250

最新推荐文章于 2024-07-31 08:46:57 发布

阅读量3.5w

点赞数 6

文章标签： mptcp tcp multipath tcp

本文链接：https://blog.csdn.net/dog250/article/details/120784839

版权

MPTCP是一个全新的古老协议，从效果上看，它对标准TCP的扩展主要体现在两方面：

多路径切换：应用程序无感知的前提下在多条链路之间进行切换。
负载均衡：使用多条路径同时传输，提高链路带宽利用率。

似乎人们对多路径切换更感兴趣，几乎所有MPTCP的资料上都会介绍MPTCP在Wi-Fi和3G之间的透明切换能力，但有趣的是，定义MPTCP的RFC6182中(详见Section 2. Goals¹)并没有提到这一点，路径备份似乎是一个附加的功能。

从本质(而不是从表面)上看，MPTCP是一个支持流量调度的资源分配协议。MPTCP将同一连接的每条路径上的数据流抽象成subflow，将所有的subflow路径上的带宽看作一个资源池，在该资源池中进行动态流量调度。

池化带宽资源，是分组交换网统计复用的极致体现。引用一段MPTCP网站blog的原话：

Since the early days of computer networks, statistical multiplexing, failure resilience and load balancing have played a key role in enabling networks to carry a growing amount of traffic. However, many of the techniques that are used today were designed under the assumption that they needed to have a local impact. Many of these designs missed the opportunity of considering the problem of pooling all the available resources as an end-to-end problem. ²

对此，先来个感官上的认识。

两条连接A和B，两条100Mbps的路径供它们使用，先看标准TCP的带宽分配情况：
在这里插入图片描述

但如果部署了MPTCP，在带宽资源分配上将更具弹性：

面对池化的带宽资源，MPTCP的核心任务就是资源分配和流量调度，目标就是最大化资源利用率。

互联网协议必须遵守公平原则，作为需要长期与标准TCP混部的MPTCP，TCP友好性必须是其一个内在特征，MPTCP必须在保证不损害标准TCP的前提下，最大化带宽资源利用率。这个任务最终由MPTCP Congestion Control负责。

为了理解这一切背后的动力学，先看MPTCP Congestion Control的三大目标：

目标1：保证所有subflow总带宽不小于最佳subflow标准TCP带宽。
目标2：保证所有subflow任意子集总体带宽不大于该子集最佳subflow标准TCP带宽。
目标3：在所有subflow之间进行动态流量调度，保证目标1和目标2的前提下最大化带宽利用率。

下文将基于MPTCP Coupled Congestion Control算法介绍。

将所有可用subflow path视为一整体，统一实施AIMD。设一条MPTCP连接的subflow set为 $R$ ， $w_r$ 为subflow $r$ 的cwnd，则：

$w_{total}=\Sigma_{r\in R}w_r$

因此，最朴素的MPTCP AIMD算法显而易见，对于所有subflow：

未发生丢包时实施AI： $w_r=w_r+\dfrac{1}{w_{total}}$
发生丢包时实施MD： $w_r=\max\{1,w_r-\dfrac{w_{total}}{2}\}$

丢包包括拥塞丢包和随机丢包，一条subflow subpath丢包率高表现为buffer过小或线路噪声大，无论如何均会导致该subpath的cwnd过小，天然满足了MPTCP的目标3。

总体来讲，目标3只需要利用为拥塞subflow计算一个较小的cwnd即可满足，这是对反馈环的利用。The way to achieve resource pooling is to effectively “couple” the congestion control loops for the different subflows.

但以上算法存在以下问题：

每条subflow丢包率差异很大，固定数量的MD行为会将高丢包率subflow饿死。
每条subflow的AI行为会抢占标准TCP流量的带宽，违背了公平性原则。

为避免高丢包率subflow被饿死，MD行为需要修正，不再MD等量cwnd，改为MD与该subflow cwnd等比例的cwnd：

发生丢包时实施MD： $w_r=\max\{1,w_r-\dfrac{w_r}{2}\}$
这样可以确保任意subflow cwnd保持一定的比例。

公平性的保证稍微复杂些，需要额外的约束。

将MPTCP的目标1和目标2的约束写成数学形式：

目标1约束： $\Sigma_{r\in R}\dfrac{w_r}{RTT_r}\geq\max_{r\in R}{\dfrac{w_r^{TCP}}{RTT_r}}$
目标2约束： $\Sigma_{r\in (S|S\subseteq R)}\dfrac{w_r}{RTT_r}\geq\max_{r\in (S|S\subseteq R)}{\dfrac{w_r^{TCP}}{RTT_r}}$

解法如下：

对于目标1，需要控制AI系数来保证所有 $w_r$ 增量至少达到最佳subpath标准TCP的效果。
对于目标2，需要为每次AI行为设置一个上界，保证其不超过标准TCP的对应AI增量。

用数学表述即：

未发生丢包时实施AI： $w_r=w_r+\min \{\dfrac{\alpha}{w_{total}},\dfrac{1}{w_r}\}$

求解 $\alpha$ 即可。

下面将用两种方法推导出 $\alpha$ 的值，首先采用MPTCP论文里的方法³，然后介绍我自己的方法。

按照Design, implementation and evaluation of congestion control for multipath TCP这篇论文中的简化模型推导，如下：
设 $p_r$ 为subflow path $r$ 的丢包率，按照数据包守恒，AI和MD速率需要相互抵消：

$(\dfrac{w_r}{RTT_r}(1-p_r))\dfrac{\alpha}{w_{total}}=(\dfrac{w_r}{RTT_r}p_r)\dfrac{w_r}{2}$

对于 $p_r$ 非常小情况，可以近似为：

$\dfrac{\alpha}{w_{total}}\approx p_r\dfrac{w_r}{2}$

对于标准TCP，设丢包率为 $p$ ，通过类似的守恒律：

$(1-p)\dfrac{1}{w_r^{TCP}}=p\dfrac{w_r^{TCP}}{2}\approx \dfrac{1}{w_r^{TCP}}$

因此：

$p=\dfrac{2}{w_r^{{TCP}^2}}$

对于特定subflow path的标准TCP，上式就是丢包率 $p$ 和 $w_r^{TCP}$ 的关系，将 $p$ 代入 $p_r$ 得到：

$w_r^{{TCP}^2}=\dfrac{w_{total}w_r}{\alpha}$

将 $w_r^{TCP}$ 的表达式代入目标约束1：

$(\Sigma_{r\in R}\dfrac{w_r}{RTT_r})^2\geq\dfrac{w_{total}}{\alpha}\max_{r\in R}{\dfrac{w_r}{RTT_r^2}}$

解出 $\alpha$ ：

$\alpha=\dfrac{\max\{\dfrac{w_r}{RTT_r^2}\}}{(\Sigma_{r\in R}\dfrac{w_r}{RTT_r})^2}$

以上就是MPTCP Coupled Congestion Control算法的介绍以及AIMD系数的推导过程。

下面是我理解的另一个视角来推导AI系数 $\alpha$ 。

根据目标1约束，设吞吐率为 $T$ ，最佳subflow path的吞吐为，：

$T_{best}=\max_{r\in R}\{\dfrac{w_r}{RTT_r}\}$

如果让该MPTCP flow所有subflow均从该path通过，则其吞吐为：

$T_{total}=\dfrac{w_{total}}{RTT_{best}}$

同时，最佳subflow path在MPTCP中的吞吐率实际占比为：

$P_{best}=\dfrac{T_{best}}{\Sigma_{r\in R}\dfrac{w_r}{RTT_r}}$

若以最佳subflow作为标准吞吐，平均分给所有的subflow，那么每一个subflow将分得：

$T_{avg}=T_{total}\times P_{best}=w_{total}\max_{r\in R}\dfrac{w_r}{RTT_r^2}$

现在问，总吞吐 $\Sigma_{r\in R}\dfrac{w_r}{RTT_r}$ 如何分割才能获得 $T_{avg}$ ：

$\alpha'\times \Sigma_{r\in R}\dfrac{w_r}{RTT_r}=T_{avg}=w_{total}\max_{r\in R}\dfrac{w_r}{RTT_r^2}$

解出 $\alpha'$ ：

$\alpha'=\dfrac{\max\{\dfrac{w_r}{RTT_r^2}\}}{(\Sigma_{r\in R}\dfrac{w_r}{RTT_r})^2}$

由于吞吐率和cwnd是同步变化的，AI系数 $\alpha$ 可取 $\alpha'$ ：

$\alpha=\alpha'$

和论文里的推导方法殊途同归，并且不再假设稳定平衡态AI，MD速率守恒。

以上只是MPTCP基本的Coupled Congestion Control算法，这只是多种CCA中的一种，还有很多诸如OLIA，BALIA，wVegas算法可供参考和研究，但目标不会改变。理解了MPTCP的3个目标，所有这些算法也就都成了细节，同时下面的问题也将不再是问题：

为什么不为每个subflow维护一个独立的cwnd呢？这样岂不是可以获得很好的加速效果吗？
如何回答这个问题，你觉得呢？

最后，无论多么优秀的算法，最终都是要落实到CPU cycles，这个时候算法的效能就成了首先要考虑的了，然而通过上述论证中看到的诸多 ${ . . . } \max\{...\}$ ， ${ . . . } \min\{...\}$ ， $\Sigma$ 算符就可以看到隐含的 $O (n)$ 时间复杂度，特别是在subflow数量特别多的时候，问题将会更加严重。如何优化它们将会是一件非常有意思的事情，只是它们不是本文的重点，后面有时间会接着谈。对于本文而言，也到了要结束的时候了。