TCP系列54—拥塞控制—17、AQM及ECN

本文详细介绍了TCP拥塞控制中的AQM(Active Queue Management)机制,特别是Random Early Detection (RED)算法,以及ECN(Explicit Congestion Notification)的工作原理。AQM旨在在路由器队列满之前检测并处理拥塞,减少丢包带来的影响。ECN则通过在IP头中设置CE标志,允许路由器显式通知TCP发生拥塞,从而减少丢包和延迟。Linux中TCP ECN的实现和配置参数也进行了讨论。
摘要由CSDN通过智能技术生成

一、概述

ECN的相关内容是在RFC3168中定义的,这里我简单描述一下RFC3168涉及的主要内容。

1、AQM和RED

        目前TCP中多数的拥塞控制算法都是通过缓慢增加拥塞窗口直到检测到丢包来进行慢启动的,这就会导致数据包在路由器缓存队列堆积,当路由器没有复杂的调度和缓存管理策略的时候,路由器一般简单的按照先进先出(FIFO)方式处理数据包,并在缓存队列满的时候就会丢弃新数据包(drop tail),这种FIFO/drop tail的路由器称为passive路由器,会导致多个TCP流同时检测到丢包,削减拥塞窗口,并进行对应的数据包重传流程。而active的路由器则会有相对高级的调度和队列缓存策略,这种路由器用来管理缓存队列的方法就称为AQM(active queue management)机制。路由器的AQM机制则会在路由器队列满之前探测到拥塞,并提供一个拥塞指示。AQM可以使用丢包或者本文后面要介绍的IP头中的Congestion Experienced (CE) codepoint来指示拥塞,这样就削减了丢包重传的影响,降低了网络延迟。之所以把CE指示放到IP头中是因为多数路由器对IP头的处理效率要高于对IP选项的处理效率。

        Random Early Detection (RED)则是AQM机制中用来探测拥塞和控制拥塞标记的一种方法。RED中有两个门限一个是minthresh,另外一个是maxthresh,当平均队列长度小于minthresh的时候,这个数据包总是会被接收处理,当平均队列长度超过maxthresh的时候,这个数据包总是会被用来指示拥塞(可能通过丢包或者设置CE来指示拥塞),当平均队列长度位于二者之间的时候,则会有一定的概率这个数据包被用来指示拥塞。RED算法是很多用在路由器和交换机中类似变种的基础,例如思科的WRED。

2、ECN

       ECN(Explicit Congestion Notification)则是在AQM机制的基础上,路由器显式指示TCP发生拥塞的的一种机制,中文一般称呼为显式拥塞通告或者显式拥塞通知。之前我们介绍的TCP的拥塞控制的相关特性都是假设TCP端与端之间的链路为一个黑盒,使用丢包来作为网络拥塞的指示,在丢包后进行重传,并开始慢启动或者快速恢复等过程。但是有些交互式操作例如网页浏览或者音视频传输等应用对于丢包和时延很敏感,因此传统的基于丢包检测拥塞的方法会使得这类应用的体验变差。如果传输层也支持ECN功能,那么可以在IP报文头中设置一个ECT(ECN-Capable Transport)指示,当中间路由器的RED算法检测到某个数据包应该用来指示拥塞的时候,如果这个数据包的ECT指示有效,那么就可以把这个数据包标记为CE,接着当接收端TCP收到这个数据包的时候,如果发现CE标志有效,那么就可以在随后的ACK报文的TCP头中设置ECN-Echo标志位来拥塞指示,发送端接收到这个拥塞指示的时候就可以对网络拥塞作出对应的响应,并在随后的数据包中把TCP头中的CWR标志为置位,接收端收到CWR指示的时候就会知道发送端已经收到并处理ECN-Echo标志,随后的ACK报文则不再继续设置ECN-Echo标志(注意pure ACK是不可靠传输的,因此接收端需要一直发送ECN-Echo直到收到发送端的CWR指示)。TCP发送端在收到ECN-Echo指示后一般拥塞状态会切换到CWR,之前介绍过CWR是一个与Recovery状态类似的状态。

        因为一些向后兼容的问题,目前部分系统对ECN的设置是默认关闭的,因此RFC7514提出了一个新的显示拥塞指示机制——RECN(Really Explicit Congestion Notification),RECN通过ICMP报文来显式的指示拥塞。本系列以介绍TCP为主,RECN相关协议格式请参考RFC7514。

3、协议格式

IP头中有个ECN field,上文提到的CE和ECT的格式如下。

从上图可以看到ECT有两种场景,ECT(0)和ECT(1)都表示发送端传输层支持ECN,按照RFC3168协议section18.1.1和section20的描述,ECT(1)是一个nonce,可以用来检验路由器是否会擦出CE指示,ECT(1)也曾打算用作其他指示,但是综合对比后还是涉及用来作为nonce了。

而上文中提到的TCP头中的ECN-Echo标志位即为ECE标志位,TCP头中的ECE标志位和CWR标志位请参考前面介绍TCP头的相关文章。

4、linux相关

linux中的TCP只使用ECT(0)来指示传输层支持ECN。在/proc/sys/net/ipv4目录下有两个设置参数与ECN相关:

tcp_ecn:0表示关闭ECN功能,既不会初始化也不会接受ECN,1表示主动连接和被动连接时候都会尝试使能ECN,2表示主动连接时候不会使能ECN,被动连接的时候会尝试使能ECN

tcp_ecn_fallback:这个参数设置为非0时,如果内核侦测到ECN的错误行为,就会关闭ECN功能。 这个参数实际上是控制后向兼容的一个参数,TCP建立连接的时候需要进行ECN协商过程,SYN报文中需要同时设置CWR和ECE标志位,如果tcp_ecn_fallback设置为非0,那么重传SYN报文的时候就会取消CWR和ECE标志的设置。

关于Linux中ECN的实现还有几点需要说明

  1. 在IP路由表中也可以设置ECN的特性使能情况,我们后面会通过示例演示。

  2. linux设置使用DCTCP拥塞控制算法的时候也会使能ECN功能。DCTCP是斯坦福和微软一起开发的一个使用RED和ECN的拥塞控制算法,可以有效的降低了缓存队列的占用。

  3. 协议要求一个发送窗口内(或者RTT内)&

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值