拥塞控制算法为何失效，网络为何难以测量？

dog250

已于 2024-09-14 20:57:43 修改

阅读量520

点赞数 10

文章标签：网络

于 2024-09-14 20:30:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dog250/article/details/142265879

版权

紧接着上文如何测量一个(传输网络)系统的容量给出的方法，看一下如何测量网络容量，如果真的能测量网络容量，传输算法就好设计了。

先给出答案，很遗憾，根本无法测量，请阅读 why we don’t know how to simulate the internet，超级经典的一篇论文，我推荐过不止一次，因此我本文不谈异构问题，说点别的，比如拓扑。

感谢 bbr 讨论组前段时间抛出的一个问题，让我知道了一个新词，parking lot topology，真的就像停车场一样，肯定很多人都有体会。

本文我就用这个拓扑来描述，实证为什么往往在实验室仿真良好的算法一旦部署到真实的网络就拉了，这有点反其道而行之的意思，因为大多数文章甚至论文都在讲标准 dumbbell topology 下的仿真，但不妨把这看作一个新方向。

我准备分别从 bbr 和 aimd 这两个经典算法分析。先看拓扑：
在这里插入图片描述

很简单，3 条流共享 2 个 buffer，先看 bbr 的表现，设 x 为预估带宽，w 为 inflt，排除 RTT 分割因素，假设 R 非常小，建模如下：

$\dfrac{dx_1}{dt}=C_1\cdot\dfrac{g\cdot x_1\cdot R}{g\cdot x_1\cdot R+w_{21}}-x_1$

$\dfrac{dx_{21}}{dt}=C_1\cdot\dfrac{g\cdot x_{22}\cdot R}{g\cdot x_{22}\cdot R+w_1}-x_{21}$

$\dfrac{dx_3}{dt}=C_2\cdot\dfrac{g\cdot x_3\cdot R}{g\cdot x_3\cdot R+w_{22}}-x_3$

$x_{22}=C_2\cdot\dfrac{x_{21}\cdot (R-\epsilon)}{x_{21}\cdot (R-\epsilon)+w_3}$

$w_{22}=x_{21}\cdot (R-\epsilon)$ 【这一步就是 Little 定律】

$\dfrac{dw_1}{dt}=x_1\cdot R-w1$

$\dfrac{dw_{21}}{dt}=x_{21}\cdot R-w_{21}$

$\dfrac{dw_3}{dt}=x_3\cdot R-w3$

设定参数如下：

C1, C2, R, g = 10, 10, 2, 1.25
x1[0], x21[0], x3[0] = 1, 6, 5

看一下表现吧：
在这里插入图片描述

任何端到端算法的动力学只作用于第一跳，不同的端到端算法就是采用不同方法利用 buffer 动力学挤兑带宽，根基就是 buffer 动力学，过了第一跳所有算法都退到自然 buffer 动力学：

$x_k=C\cdot\dfrac{w_k}{\sum w_i}$

看，是不是 bbr 的 gain 效应没了，人们预期的是：

$x_k=C\cdot\dfrac{g\cdot x_k\cdot R}{\sum w_i}$

可这个只在第一跳生效，如上面模型所示。总结，上游输出不会携带算法的药效。

再来看 aimd 的表现，建模如下：

$\dfrac{dx_1}{dt}=C_1\cdot\dfrac{w_1}{w_1+w_{21}}-x_1$

$\dfrac{dx_{21}}{dt}=C_1\cdot\dfrac{w_{21}}{w_{12}+w_1}-x_{21}$

$\dfrac{dx_3}{dt}=C_2\cdot\dfrac{w_3}{w_3+w_{22}}-x_3$

$x_{22}=C_2\cdot\dfrac{x_{21}\cdot r_2}{x_{21}\cdot r_2+w_3}$

$w_{22}=x_{21}\cdot r_2$ 【这一步就是 Little 定律】

$\dfrac{dw_1}{dt}=\begin{cases} 1,& D=0\\0.5\cdot w_1,& D=1\end{cases}$

$\dfrac{dw_{21}}{dt}=\begin{cases} 1,& D=0\\0.5\cdot w_{21},& D=1\end{cases}$

$\dfrac{dw_3}{dt}=\begin{cases} 1,& D=0\\0.5\cdot w_3,& D=1\end{cases}$

$r_1=\dfrac{w_1+w_{12}}{C_1}$

$r_2=\dfrac{w_2+w_{22}}{C_2}$

与 bbr 同样初始值，g = 1.25 换成 I = 1，10X bdp buffer，结局如下：
在这里插入图片描述

如果 buffer 1 输出 C1 = 10，buffer 2 输出 C2 = 20，结局如下：
在这里插入图片描述

和 bbr 的动力学一样，细节不同：

上游输出带宽不会将 additive increase 传递到下游，特别瓶颈在上游时(输出固定，不足以填充下游)；
任意一跳丢包都会导致 multiplicative decrease。

再多的例子我就不举了，总之这只是一个简单的拓扑，但足以表示真实网络的抽象，不必引入更复杂拓扑，只需细细斟酌上面 bbr 的例子就足够。我们清楚知道这个模型中， $R+\epsilon$ 很重要，因为 buffer 2 中计算 w22 时并不能直接用 R，那么用什么呢？如果 $\epsilon=-0.5\cdot R$ ，f 2 就会被压到虚无。

我到底想说什么？我想说的是端到端拥塞控制算法的不可度量性，无论是静态适配的 aimd 还是动态适配的 bbr，这就是我逼逼呵呵说了好几年的 “测不准” 的数学表达。

这和上一篇说的测量系统容量的方法并不矛盾，因为对于网络传输系统而言，系统是动态变化的，在流量部署到系统上并开始传输时，没有全局视图，就不能指望全局公平，留下的 gap 是固有的，没法靠算法弥补。

如果拥有全局视图，对于第一个例子 bbr 算法，我们只需要将 f2 的 gain 调大就可以确保公平：
在这里插入图片描述

可是谁又提前知道这个拓扑和配置呢？

所以你知道实验室仿真的宇宙第一算法为啥拉了吧，也就不用再问为什么部署了 bbr 却还不如 cubic 了吧，如果你还希望研发一个精准的，普适的端到端算法，我劝你改行去卖皮鞋，至少还有很多经理市场。

令人费解的是，我为什么要说这些，这不是砸自己饭碗吗？对，就是要砸，因为我不干了。

浙江温州皮鞋湿，下雨进水不会胖。

关注

10
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

dog250

CSDN认证博客专家 CSDN认证企业博客

码龄17年

2166: 原创

2464: 周排名

9: 总排名

2480万+: 访问

: 等级

17万+: 积分

2万+: 粉丝

1万+: 获赞

5542: 评论

1万+: 收藏

私信

关注

热门文章

最新评论

从tcpdump看cBPF/eBPF程序设计
kongu106: 一台机器部署了两个Redis，分别是A和B，基于libpcap实现一个抓包程序，过滤规则是：tcp and dst port A端口 and dst host AIp，但是发现在B节点上收到发送给A节点的数据，机器和网卡都分析过，无问题；怀疑可能是抓包引起的，楼主遇到过类似问题或指点一下思路
Linux实现的IEEE 802.1Q VLAN
renjie0310: 没看懂最后那个图，脱掉tag后（vlan10）为啥直接去了ETH0.Y（vlan y），这是怎么操作的。没有理解。
走进四维空间-我们如何理解时空
随意~无所谓: 如果时间是第四维，那么代表四维生物能掌控时间。但，在人类的设定中，四维生物能够掌控时间吗？对于二维生物来说，他们在二维世界里面随意行走，三维生物清楚观察到他们。二维生物可以往左走，往右走。但四维生物观察三维却是不可逆转的时间。也就是所谓的可逆性。
夜谈弱网场景的TCP
Ha_Ha_Wu: 大佬写的有点难懂
Linux Stateless无状态NAT-使用TC来配置
2301_78576735: 大佬，我按照类似的方式来做，似乎不太符合预期。于是有个疑问：在 Ingress 处做了DNAT，此时src_ip并没有变，数据包就这么从eth2接口发出去了，理论上数据包是回不来吧，所以给回来的数据包准备的 SNAT 规则实际上用不上.

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。