TCP的超时重传之深入了解RTT与RTO

TCP提供一种面向连接的、可靠的字节流服务,其中可靠的保证方法之一就是却让从另一端收到的数据。但是数据和确认信号都有可能丢失,。TCP通过在发送数据时设置一个重传定时器(注意这里的超时定时器和第四节讲的定时器不一样)来监控数据的丢失状态,如果重传定时器溢出时还没收到确认信号,则重传该数据。这就是建立重传机制的原因。 
下面解释两个名词: 
RTT(Round Trip Time):一个连接的往返时间,即数据发送时刻到接收到确认的时刻的差值; 
RTO(Retransmission Time Out):重传超时时间,即从数据发送时刻算起,超过这个时间便执行重传。 
RTT和RTO 的关系是:由于网络波动的不确定性,每个RTT都是动态变化的,所以RTO也应随着RTT动态变化。

一、RTT估计器
首先要明白一个问题,为什么要做一个RTT估计器?在开篇就讲到了TCP连接在重传定时器溢出就会重传数据。那么溢出时间怎么计算,即RTO如何计算?如果设置过短,则会造成重传频繁,加快网络阻塞;设置过长,则会导致性能下降(失序的报文段得不到确认,接收方无法提交给进程)。所以,超时计算的算法应该能够反映当前网络的拥塞情况,而每个连接的RTT恰恰能够反映这一点,所以设计好的RTT估计器是计算 RTO 的第一步。 
由于大多数的TCP实现仅仅在某一时刻为一个已发送但尚未确认的报文段做一次RTT采样,得到一个SampleRTT,而不是为每一个发送的报文段都测量RTT,从而用这个SampleRTT来接近(代表)所有RTT。

一个连接中,有且仅有一个测量定时器被使用。也就是说,如果TCP连续发出3组数据,只有一组数据会被测量。
TCP决不会为已被重传的报文段测量SampleRTT,仅仅为传输一次的报文段测量SampleRTT。
ACK数据报不会被测量,原因很简单,没有ACK的ACK回应可以供结束定时器测量。
由于路由器的拥塞和端系统负载的变化,由于这种波动,用一个报文段所测的SampleRTT来代表同一段时间内的RTT总是非典型的,为了得到一个典型的RTT,TCP规范中使用低通过滤器来更新一个被平滑的RTT估计器。TCP维持一个估计RTT(称之为EstimatedRTT),一旦获得一个新SampleRTT时,则根据下式来更新EstimatedRTT: 
EstimatedRTT = (1-a)* EstimatedRTT + a * SampleRTT 
其中a通常取值为0.125,即:

EstimatedRTT = 0.875 * EstimatedRTT + 0.125 * SampleRTT

每个新的估计值的87.5%来自前一个估计值,而12.5%则取自新的测量。

关于估计器的更新: 
在一个报文段被发送和确认之前阻止更新估计器。

二、RTT的方差跟踪
在最初的RTO算法中,RTO等于一个值为2的时延离散因子与RTT估计值的乘积,即:

RTO = 2*EstimatedRTT

但这种做法有个很大的缺陷,就是在RTT变化范围很大的时候,使用这个方法无法跟上这种变化,从而引起不必要的重传。怎么理解呢?由于新测量SampleRTT的权值只占EstimatedRTT的12.5%,当实际RTT变化很大的时候,即便测量到的SampleRTT变化也很大,但是所占比重小,最后EstimatedRTT的变化也不大,从而RTO的变化不大,造成RTO过小,容易引起不必要的重传。因此对RTT的方差跟踪则显得很有必要。 
在TCP规范中定义了RTT偏差DevRTT,用于估算SampleRTT一般会偏离EstimatedRTT的程度:

DevRTT = (1-B)*DevRTT + B*|SampleRTT - EstimatedRTT|

其中B的推荐值为0.25,当RTT波动很大的时候,DevRTT的就会很大。

三、设置重传时间间隔RTO
如上面所述得到了EstimatedRTT和DevRTT,很明显超时时间间隔RTO应该大于等于EstimatedRTT,但要大多少才比较合适呢?所以选择DevRTT作为余量,当波动大时余量大,波动小时,余量小。则组后超时重传时间间隔RTO的计算公式为:

RTO = EstimatedRTT + 4 * DevRTT

在[RFC 6298]中,推荐初始超时重传时间为1秒,当出现超时后,超时重传时间将以指数退避的方法加倍,以免即将被确认的后继报文段过早出现超时。不管如何,一旦报文段收到并更新EstimatedRTT 后,超时重传时间便会按上式计算。具体阐述如下: 
超时间隔加倍: 
假设当前超时重传定时器溢出时,与最早的未被确认的报文段相关联的RTO为0.75s,TCP就会重传报文段,并版新的RTO设置为1.5s,如果1.5s后又溢出了,则TCP将再次重传报文段,并把RTO设置为3秒。因此,超时间隔在每次重传后会呈指数上升,然而每当重传定时器在另外两个事件(收到上层应用的数据和收到ACK)中的任意一个启动时,RTO有最近的EstimatedRTT 和DevRTT重新计算。

四、实际RTT和RTO测量
首先在这里要区分重传定时器和TCP连接可供调用的时钟定时器。

重传定时器:当TCP发送报文段时,就创建这个特定报文段的重传定时器,若在定时器超时之前收到对报文段的确认,则撤销定时器;若在收到对特定报文段的确认之前计时器超时,则重传该报文,并且进行RTO = 2 * RTO进行退避。
可供调用的TCP时钟定时器:一个TCP连接只有一个这样的定时器用于测量RTT,一般情况下是500ms定时器,并且只能够被一个报文段占用,即在发送一个报文段时,如果给定连接的定时器已经被使用,则该报文段不被计时(不计算该报文段的RTT,这就解释了不是所有报文段都能被计算RTT)。(这里的定时器应该是调用系统时钟)
 
好,回到RTT的测量上来。实际中RTT的测量并不是那么精确,比如说一个报文段的确认信号在它发送550ms后到达,那么该报文段的往返时间RTT将是500ms或者1000ms(假设使用500ms定时器计时)。为什么会这样呢?因为在调用500ms定时器的同时会增加一个计数器来辅助计时,计数器的每一个滴答(tick)代表定时器转好一圈500ms,两个滴答则表示1000ms。可惜的是定时器和计数器做不到无误差的同时启动,往往计数器会在定时器启动的一段时间内启动,但间隔很小。 


从图上可以看到时间间隔为500ms的时钟滴答,报文段1在0处发出(同时定时器开始启动)假设计数器在定时器启动0.03s后开始计数,报文段1 的确认在1.061s出收到,那么在发送报文段1和接收到报文段1的确认信号之间经历了3个滴答,所以报文段1的RTT为1500ms。之后的RTT也是这么计算。所以说得到的实际RTT总是500ms的倍数。

在公式初始化重传超时公式的时候中,常常使用:

RTO = EstimatedRTT + 2 * DevRTT只有在初始化的时候系数为2,之后的系数仍为4。

EstimatedRTT初始化为0,DevRTT的初始值随TCP版本实现不同而定。而后每次根据测量的RTT对RTO进行更新。实际上RTO的值也基本上是500ms的倍数,这是由于通常情况下余量的波动并不会很大。
 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值