9.4.1 Why
TCP发送的数据如果丢失则快速重传算法会立即重传数据而不用等到重传定时器超时,从而快速地恢复数据。如果发送端接收不到足够数量(一般来说是3个)的ACK,则快重传算法无法起作用,这个时候就只能等待RTO超时。ER算法主要是为了解决这个问题。在下面的条件下,就会导致收不到足够的ACK:
(1)拥塞窗口比较小
(2)窗口中一个很大数量的段丢失或者在传输的结尾处发生了丢包
如果满足了上面的两个条件,那么就会发生发送端由于接收不到足够数量的ACK导致快重传算法无法生效。比如拥塞窗口是3,然后第一个段丢失了,那么理论上最多发送段只可能收到2个重复的ACK,此时由于快重传要求3个重复的ack,那么发送端将会等待RTO超时,然后重传第一个段。
在上面的第二个条件中,有两种可能性,其中ER算法是为了解决第一种可能性(也就是当连续的很多段丢失)。而第二种情况则需要TLP(Tail Loss Probe)来解决。
接下来来描述一下ER的算法。ER可以基于两种模式,一种是基于字节的,一种是基于段(segment-based)的,Linux中的ER是基于段的。ER算法会在小窗口下(flight count 小于4)减小触发快重传的重复ACK的阈值,比如减小到1或者2。而在Linux的实现中为了防止假超时会加上一个延迟再重传数据,这个功能就靠ER定时器实现。
9.4.2 When
TCP在收到ACK时会调用tcp_fastretrans_alert函数判断是否需要快速重传:
2745 static void tcp_fastretrans_alert(struct sock *sk, int pkts_acked,
2746 int prior_sacked, int prior_packets,
2747 bool is_dupack, int flag)
2748 {
...
2828 if (!tcp_time_to_recover(sk, flag)) {
2829 tcp_try_to_open(sk, flag, newly_acked_sacked);
2830 return;
2831 }
...
tcp_time_to_recover函数
决定什么时候进入Recovery状态:
2076 static bool tcp_time_to_recover(struct sock *sk, int flag)
2077 {
2078 struct tcp_sock *tp = tcp_sk(sk);
2079 __u32 packets_out;
2080