[ 网络原理 ] TCP协议-CSDN博客

1. 那发送方何时进行重传呢？

其实它是有一个等待时间的，当发送方发出数据一段时间之后，如果在这段时间内，收到 ack ，就视为数据到达，如果没有收到 ack ，就会视为丢包（可能是数据，也可能是ack），此时就会触发重传机制。

2. 那如果接收方突然断开网络，那发送方会一直重传吗？

当然不会，当重传第一次还是没有收到，此时第二次等待的时间会比第一次更长，时间拉长也不是无限拉长，当达到一定程度时，就会认为无论重发多少次，都不可能到达，此时就会放弃 tcp 连接了。

3. 当 ack 丢失的时候，发送方就会重传，那接收方不就收到相同的数据了吗，那怎么处理呢？

其实 TCP 已经很贴心的帮我们将这个问题给解决了， TCP 会有一个接收缓存区，也就是一个内存空间，会保存当前已经收到的数据，以及数据的序号，当发送数据重复时，接收方就会直接把后来的数据给丢弃，确保应用程序在读取数据的时候，不会读到同一个数据多次。

3.3 连接管理

（1）建立连接 --- 三次握手

这里的三次握手，只是打招呼，并没有实际意义，只是为了唤起对方的注意

这里的三次握手就好比于：

在 TCP 中，“ 三次握手 ”发送的数据包并不是真正要发送的数据，而是一个特殊的 TCP 数据报，它在 TCP 的报头中有显示（syn 位为1 ，表示是同步报文段；为0，则不是）：

所以上述握手就可以看成这样：

综上, 三次握手的作用有这些：

   （1）确保当前网络是否通畅

   （2）让发送方和接收方都能确认自己的发送能力和接收能力均正常

   （3）让通信双方在握手的过程中，协商一些重要的参数（比如 tcp 的序号从哪开始）

（2）断开连接 --- 四次挥手

断开连接本质上跟建立连接差不多。

这里主机 A 跟主机B 说它要断开连接，其实是发送了一个结束报文段（FIN）：

那这里能不能跟上述建立连接一样，将 FIN 和 ACK 一起发送过去呢？

答案显然是不行的，首先在建立连接的时候，ACK和SYN 都是内核触发的，属于同一个时机，所以可以合并在一起；而这里断开连接，FIN 是应用程序执行完 close 之后触发的，实际并不相同，所以不能合并成三次挥手。

注意：

  发送方A 是否收到接收方B 发送的 FIN 就会断开连接呢？

   答案显然不会。你看，如果发送方A 接收到接收方B 发送的 FIN 就直接断开连接了，ACK 恰好丢包了，那接收方B 就会接收不到 ACK ，就会在一段时间之后触发超时重传，但是发送方A 已经断开连接了，那接收方B 就一直触发超时重传，但是 B 永远也就收不到 ACK 了。

   所以，当 A 收到 FIN 之后，会先处于 TIME_WAIT 状态，并且等待 2MSL（网络上两节点通信消耗的最大时间为 MSL）之后，如果还没有收到 B 超时重传的 FIN ，此时 A 才会断开连接。

如下图：

前面三个机制，都是在确保 tcp的可靠性，但是，提升可靠性的同时，效率却降低了，为让可靠传输对性能的影响更小一些，就引入了滑动窗口。

3.4 滑动窗口

刚才我们讨论了确认应答策略，对每一个发送的数据段，都要给一个ACK确认应答。收到ACK后再发送下一个数据段。这样做有一个比较大的缺点，就是性能较差。尤其是数据往返的时间较长的时候。

既然这样一发一收的方式性能较低，那么我们一次发送多条数据，就可以大大的提高性能（其实是将多个段的等待时间重叠在一起了）。

1. 窗口大小指的是无需等待确认应答而可以继续发送数据的最大值。上图的窗口大小就是 4000 个字节（四个段）。

2. 发送前四个段的时候，不需要等待任何 ACK ，直接发送；

3. 收到第一个 ACK 后，滑动窗口向后移动，继续发送第五个段的数据；依次类推；

4. 操作系统内核为了维护这个滑动窗口，需要开辟 发送缓冲区 来记录当前还有哪些数据没有应答；只有确认应答过的数据，才能从缓冲区删掉；

5. 窗口越大，则网络的吞吐率就越高；

那么如果出现了丢包，如何进行重传？

情景一： 数据包没丢，应答报文 ACK 丢了

这种情况下，部分ACK丢了并不要紧，因为可以通过后续的ACK进行确认；

情景二： 数据包丢了

（1）当某一段报文段丢失之后，发送端会一直收到 1001 这样的 ACK ，就像是在提醒发送端 " 我想要的是 1001" 一样；

（2）如果发送端主机连续三次收到了同样一个 "1001" 这样的应答，就会将对应的数据 1001 - 2000 重新发送；

（3）这个时候接收端收到了 1001 之后，再次返回的 ACK 就是 7001 了（因为 2001 - 7000 ）接收端其实之前就已经收到了，被放到了接收端操作系统内核的接收缓冲区 中；

3.5 流量控制

接收端处理数据的速度是有限的。如果发送端发的太快，导致接收端的缓冲区被打满，这个时候如果发送端继续发送，就会造成丢包，继而引起丢包重传等等一系列连锁反应。

因此 TCP 支持根据接收端的处理能力，来决定发送端的发送速度。这个机制就叫做 流量控制。

（1）接收端将自己可以接收的缓冲区大小放入 TCP 首部中的 " 窗口大小 " 字段，通过 ACK 端通知发送端；

（2）窗口大小字段越大，说明网络的吞吐量越高；

（3）接收端一旦发现自己的缓冲区快满了，就会将窗口大小设置成一个更小的值通知给发送端；发送端接受到这个窗口之后，就会减慢自己的发送速度；

（4）如果接收端缓冲区满了，就会将窗口置为0 ；这时发送方不再发送数据，但是需要定期发送一个窗口探测数据段，使接收端把窗口大小告诉发送端。

3.6 拥塞控制

虽然TCP 有了滑动窗口这个大杀器，能够高效可靠的发送大量的数据。但是如果在刚开始阶段就发送大量的数据，仍然可能引发问题。

因为网络上有很多的计算机，可能当前的网络状态就已经比较拥堵。在不清楚当前网络状态下，贸然发送大量的数据，是很有可能引起雪上加霜的。

TCP引入 慢启动 机制，先发少量的数据，探探路，摸清当前的网络拥堵状态，再决定按照多大的速度传输数据；

（1）当TCP 开始启动的时候，慢启动阈值等于窗口最大值；

（2）在每次超时重发的时候，慢启动阈值会变成原来的一半，同时拥塞窗口置回1 ；

（3）少量的丢包，我们仅仅是触发超时重传；大量的丢包，我们就认为网络拥塞；

（4）当TCP 通信开始后，网络吞吐量会逐渐上升；随着网络发生拥堵，吞吐量会立刻下降；拥塞控制，归根结底是TCP协议想尽可能快的把数据传输给对方，但是又要避免给网络造成太大压力的折中方案。

TCP 拥塞控制这样的过程，就好像 热恋的感觉

3.7 延时应答

如果接收数据的主机立刻返回ACK 应答，这时候返回的窗口可能比较小。

（1）假设接收端缓冲区为 1M 。一次收到了 500K 的数据；如果立刻应答，返回的窗口就是 500K ；

（2）但实际上可能处理端处理的速度很快， 10ms 之内就把 500K 数据从缓冲区消费掉了；

在这种情况下，接收端处理还远没有达到自己的极限，即使窗口再放大一些，也能处理过

来；

（3）如果接收端稍微等一会再应答，比如等待 200ms 再应答，那么这个时候返回的窗口大小就是 1M；

一定要记得，窗口越大，网络吞吐量就越大，传输效率就越高。我们的目标是在保证网络不拥塞的情况下尽量提高传输效率；

那么所有的包都可以延迟应答么？肯定也不是

数量限制：每隔 N 个包就应答一次；

时间限制：超过最大延迟时间就应答一次；

3.8 捎带应答

在延迟应答的基础上，我们发现，很多情况下，客户端服务器在应用层也是 " 一发一收 " 的。意味着客户端给服务器说了 "How are you" ，服务器也会给客户端回一个 "Fine, thank you" ；

那么这个时候ACK 就可以搭顺风车，和服务器回应的 "Fine ， thank you" 一起回给客户端；这里的捎带应答在三次握手中有所体现。

3.9 面向字节流

由于 TCP 在数据传输的时候是面向字节流的，接收方在接受的时候会先创建一个接收缓存区，将多个应用层的数据包的数据，以字节的形式仅仅挨在一起，那接收方的应用程序在读取数据的时候，由于所有的数据包的数据都紧挨在一起，接收方就无法判断从哪个字节到哪个字节是一个完整的数据包了。这就是粘包问题。

粘包问题

粘包问题就是，接收方无法判断每个数据包的边界，那么要解决粘包问题，就给它规定好边界即可。

1. 引入分隔符