哈工大计算机网络课程传输层协议之:拥塞控制原理剖析

哈工大计算机网络课程传输层协议之:拥塞控制原理剖析


**拥塞(Congestion)**
  • 非正式定义:“太多发送主机发送了太多数据或者发送速度太快,以至于网络无法处理。”

  • 表现:

    • 分组丢失(路由器缓存溢出)
    • 分组延迟过大(在路由器缓存中排队,排队延迟)
  • 拥塞控制 vs. 流量控制

    • 流量控制更多是从个人角度出发,考虑端对端交互时的异常问题处理。而拥塞控制更多是从群体角度出发,考虑的是整体网络的传输问题,控制整个网络的传输负载。
  • A top-10 problem

  • 拥塞成因和代价:场景1

    • 两个senders,两个receivers
    • 一个路由器,无限缓存,链路带宽为C
    • 没有重传

    在这里插入图片描述

    由于假定的条件是路由器无限缓存,因此链路上不存在路由器的缓存排队延迟,即无论发送方发送多少数据,都可以传输到接收方,且没有丢包的问题,也就没有重传。

    在这样的场景下,会得到什么的吞吐率和时延?

    在这里插入图片描述

    λin表示发送方发送数据速率,λout表示路由器的输出速率。

    因此有两个Sender和Receiver,当Sender的发送量在链路带宽C/2时,发送端的发送速率和接收方的接收速率成线性关系。而当超过C/2时,达到了路由器传输数据的最大链路带宽,因此路由器的吞吐率稳定在C/2上。

    当输入速率接近C/2时,理论上,时延接近于无限大,因为已经达到了路由器的最大链路带宽。

    即便是这样理想的场景下,拥塞带来的网络传输影响也是很大的。

    拥塞成因和代价:场景2

    一个路由器,有限buffers

    Sender重传分组

    在这里插入图片描述

    在这种场景下,路由器的缓存是有限的,因此也就有了丢包和重传问题。λin’表示原始的发送数据加上重传数据。

    • 情况a:假设Sender能够通过某种机制获知路由器Buffer信息,因此,Sender在路由器有空闲才发数据,也就是不会出现数据在路由器阻塞的情况,因此在发送速率 <= R/2时,一直都是线性的关系,λin = λout。
    • 情况b:丢失后才重发,由于还存在丢失重发的分组,所以可知有:λin’ > λout,意味着有效的吞吐率变低了。
    • 情况c:分组丢失和定时器超时后都重发,相比情况b多了重传的场景,因此λin’变得更大,有效的吞吐率变得更低了。

    在这里插入图片描述

    拥塞的代价:

    • 为了保证数据的正确传输,需要做更多的工作,比如重传。
    • 造成资源的浪费。

    拥塞成因和代价:场景3

    场景3引入多跳的路由网络。

    • 四个发送方
    • 多跳路由器,路由器缓存有限。
    • 超时/重传

    在这里插入图片描述

    问题:随着λin和λin’不断增加,会怎么样?

    如上图所示,以路由器R2举例来说,承载着主机A与主机C的信息交互,以及主机B和主机D的信息交互,这两个不同的链路间在R2路由器上存在资源竞争,也同样会导致R2的缓存排队、丢包等问题,导致重发,进一步造成网络拥塞,路由器吞吐率降低,跟场景2、情况c的情况类似。

    而这种场景跟上面场景的最大区别在于,当数据到达R2路由器时,说明该数据已经被上一跳的路由器存储转发处理完了。然后,在R2时,由于拥塞导致分组被丢掉了,此时上一跳路由器的对数据的处理也是被浪费掉了。

    所以,在多跳网络中,拥塞会造成另一个代价:

    • 当分组被丢弃时,任何用于该分组的“上游”传输能力全都被浪费掉了。
    • 造成了网络性能、吞吐率更差了

    在这里插入图片描述

    如上图所示,在这样一个多跳网络中,网络吞吐率会变成这样一个趋势。当λin’比较小时,网络的拥塞情况还比较小,重发的情况比较少,所有网络吞吐率和发送率还成线性关系。而当发送速率增大到网络传输最大带宽时,拥塞情况不断加重,吞吐率迅速下降。甚至当发送速率增大到一定值时,吞吐率降低到几乎0。因为这种情况下可能网络中传输的已经全被都是不断重发的分组,而没有数据被正确接收了,说明这个网络已经瘫痪掉了。

    如何进行拥塞控制

    针对上述的拥塞问题如何解决?

    通过上面的分析我们知道,造成拥塞的核心原因是发送端无休止的以太快的速率发送数据,而不关心网络当下的状态。因此要解决拥塞问题,直观的方法就是根据当前网络的传输状态,控制发送端的发送速度。

    思考:为什么拥塞控制放在传输层做,而不是放在应用层?

    拥塞控制的方法

    两种方法:

    1. 端到端的拥塞控制
    • 网络层不需要显示的提供支持
    • 由端系统通过观察loss, delay等网络行为判断是否发生拥塞
    • TCP采取的就是这种方法
    1. 网络辅助的拥塞控制
    • 路由器向发送方显示地反馈网络拥塞信息
    • 基于简单的拥塞指示(1bit):SNA,DECbit,TCP/IP,ATM
    • 指示发送方应该采取何种速率

    TCP拥塞控制的基本原理

    处理拥塞需要面对三个问题:

    1. 如何控制Sender的发送速率:

    在这里插入图片描述

    CongWin):

    • 需要动态调整以改变发送速率
    • 反映所感知到的网络拥塞

    CongWin表示拥塞窗口的大小,计算发送的最后一个字节的序列号 减去 最后一个接收到的ACK字节的序列号,这个计算的差值即表示当前网络中正在传输的数据大小。 让计算得到的差值小于设置的拥塞窗口大小。

    这种拥塞控制的是已发送但还未收到ACK的数据量大小,因此粗略来讲,在一个RTT时间内,会发送CongWin窗口大小的数据量,因此发送速率的计算就是拥塞窗口的大小 除以 RTT的大小。

    1. 如何感知网络拥塞?

      • Loss丢失事件:timeout或3个重复ACK
      • 发送loss时间后,发送方减低速率
    2. 如何合理地调整发送速率?

      • 加性增—乘性减:AIMD(拥塞避免机制)

      • 慢启动:SS

    加性增—乘性减:AIMD

    原理:逐渐增加发送速率,谨慎探测可用带宽,直到发生loss

    方法:AIMD

    • Additive Increase:每个RTT将CongWin增大一个MSS(指最大段长度)—拥塞避免思想
    • Multiplicative Decrease:发送loss后将CongWin减半

    在这里插入图片描述

    慢启动:SS

    TCP连接建立时,初始化CongWin=1,例如:

    • MSS = 500 byte,RTT = 200ms
    • 初始速率 = 20 kbps

    由于初始速率比较小,可用带宽可能远远高于初始速率:

    • 如果开始阶段还是使用线性增长的话,可能需要增长很长一段时间才能增长到可用带宽,存在资源浪费

    • 因此,希望在开始阶段快速增长

    原理:

    • 当连接开始时,发送速率成指数增长。

    伪代码如下所示:

    在这里插入图片描述

    在指数型增长阶段:

    • 每个RTT将CongWin范围
    • 收到每个ACK进行操作

    采用慢启动这种方式时,即使初始速率很慢,但是可以快速攀升,比如下图所示过程:

    在这里插入图片描述

    那么对于上述涉及的两种增加方式(线性增长、指数增长),它们之间是什么联系?

    何时应该指数型增长切换为线性增长(拥塞避免)?

    A:当CongWin达到Loss事件前值的1/2时。

    实现方法:

    • 需要定义一个Threshold变量。
    • 当Loss丢失事件发生时,用Threshold这个变量表示Loss事件前CongWin的1/2。
    • 当指数型增长达到Threshold值时,将指数型增长变为线性增长,进入拥塞避免机制。

    在这里插入图片描述

    初始时,拥塞窗口设置为1,在前4个时刻,是指数型增长,大小变到8。当CongWin到达Threshold时,将指数型增长变更为线性增长,只增加1。到第8个时刻时,拥塞窗口增大到12。此时,检测到网络有拥塞,在TCP早期版本时,会重新把拥塞窗口将为1,再重新执行上述过程(先指数、再线性)。

    同时,当网络发送拥塞时,也会更新Threshold得值,把Threshold的值更新为发生拥塞时,拥塞窗口大小的一半,这里也就是Threshold=6。

    TCP早期版本对于发生拥塞时的处理过于激进,直接把大小重新变为1。因此,后续的TCP版本进行了改进,将拥塞窗口更新为发送拥塞时的一半大小,跟Threshold大小一致。因此,更新后直接进入线性增长阶段。

    Loss事件的处理

    我们知道,检测丢失事件有两种方式:收到3个重复ACK和Timeout事件。

    拥塞窗口面对这两种事件的处理方式是不一样的:

    1. 3个重复ACKs:
      • CongWin拥塞窗口切到一半(乘性减)
      • 然后再线性增长
    2. Timeout超时事件:
      • CongWin直接设为1个MSS(即减到拥塞窗口的最小值)
      • 然后再指数增长
      • 达到threshold后,再线性增长

    为什么这两种事件的处理要不一样?

    细想一下,当收到3个重复ACKs,说明这个时候整体网络中还是有传输数据段Segment的能力的(包括传输乱序数据段或是返回的ACK数据),代表可能拥塞的情况相对来说没有那么严重。

    而当触发timeout超时事件时,可能是发送的数据拥塞到没能到达接收端,或是返回的ACK甚至都没能到达发送端, 说明拥塞的情况相对来说是更严重的,因此需要使用更激进的策略来减少发送速率。

    总结
    1. 当拥塞窗口低于Threshold时,发送端处于慢启动阶段,拥塞窗口呈指数型增加,来探测网络中的拥塞情况。
    2. 当拥塞窗口超过Threshold时,说明发送速率已经超过了一定阈值,需要降低发送速率。此时,发送端处于拥塞避免阶段,拥塞窗口成线性增长。
    3. 当发送端收到3个连续的ACK时,说明当前网络可能已经遇到了拥塞,首先将Threshold参数设置为当前拥塞窗口的一半,并将拥塞窗口降低到Threshold值。
    4. 而当timeout事件发送时,说明网络拥塞的情况可能更严重,此时Threshold参数设置为当前拥塞窗口的一半,并将拥塞窗口直接设置为1个MSS的大小。

    拥塞控制原理总结汇总:

    在这里插入图片描述

    TCP拥塞控制算法

    TCP拥塞控制算法过程伪代码如下所示:

    在这里插入图片描述

    下面我们以一个简单的例题,来检测对上述原理的理解

    例题: 一个TCP连接总是以1KB的最大段长发送TCP段,发送方有足够多的数据要发送。当拥塞窗口为16KB时发生了超时,如果接下来的4个RTT(往返时间)时间内的TCP段的传输都是成功的,那么当第4个RTT时间内发送的所有TCP段都得到肯定应答时,拥塞窗口大小是多少?

    解答: 因为拥塞窗口为16KB时,发送的是超时事件,所以根据上面的介绍,此时拥塞窗口会直接降为1KB,同时Threshold降为拥塞窗口的一半,即=8KB。而之后会首先进入慢启动阶段,在1个RTT后,CongWin=2, 2个RTT后,CongWin=4,3个RTT后,CongWin=8。此时到达了Threshold的阈值,之后要变成线性增长,因此当第4个RTT后,CongWin=9。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

JermeryBesian

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值