今天聊聊TCP,老规矩,为了更符合读者的思考逻辑,文章依然由问题来组织:
- 在一个不可靠的网络中,如何做到可靠的传输?
- TCP的连接到底是啥?
- “三次握手”做了什么?
- “四次挥手”做了什么?
- 丢包重传是怎么做的?
- 服务器处理不过来了, 你能发慢点吗?
- 好慢啊,网络卡了?
先补充一点前置知识,我们讨论的TCP,属于TCP/IP模型的传输层(第四层),向下基于IP层,向上支撑了应用层。
就像本文的结构一样,这个世界是由问题组成的,协议的诞生是为了解决问题。TCP解决了这样一个问题:
问题1: 在一个不可靠的网络中,如何做到可靠的传输?
这里说的可靠,并不是说发送的数据一定能收到,下层的IP包该丢还是丢;仅仅是指对方收到了我的包,会发一个响应包给我,告诉我收到了;只要是没收到响应包,都按丢了处理,检测到丢包后按照一定的逻辑进行重发,如果实在是收不到,就按照失败来处理了。
关于可靠传输还有一个问题就是:乱序,TCP的包有严格的顺序,如果后面的包先到了,接收端要能够检测到,并且正确的处理。乱序的原因可能是前面的包丢了,或者后面的包先到了。
为了便于理解,我们来看一下TCP Header的格式:
TCP Header格式
这个图会多次出现,这里我们只关注两个数据:
- Sequence Number: 包的序号,用于解决乱序的问题。
- Acknowledgment Number: ACK,就是响应包,用于解决丢包的问题。
所以,做到可靠的底层逻辑是:增加冗余。
与UDP相比,TCP的(几乎)每个包都有响应包,这已经让包的数量增加了一倍。另外,丢包时要重发,甚至多次重发,做到可靠的方式就是有组织地增加冗余。
TCP宣称自己是面向连接的,传输数据之前要先建立连接,那么问题来了:
问题2: TCP的连接到底是啥?
按照老美的套路,我们先聊一聊它不是什么?
有一种相当普遍的错误理解:
TCP连接是互联网上的一条专属通道,就像是在两端建立了一座桥。
上面的错误说法非常流行,建立TCP的连接对于IP层没有任何改造。IP层也不关心这个包是是不是TCP的包。
TCP建立连接的含义是: 两端的设备创建了一些数据结构,这些数据结构包含了对方的信息(IP和端口和状态等),建立连接的过程就是数据结构中连接状态变为“已连接”的过程,后面发送端发送数据到接收端,接收端经过检查发现在自己数据结构中包含了对方的IP和端口,就会正常地接收这个包,仅此而已。
所以,TCP连接仅仅是两端维护的“连接状态”,都说建立连接的过程叫“三次握手”,那么问题来了:
问题3: “三次握手”做了什么?
既然TCP的连接仅仅是“状态维护”,那么TCP就有一套状态集合,包含了TCP的所有状态,这套状态集合就是TCP的状态机。
回到TCP Header格式图:
TCP Header格式
这次关注的数据是:
- TCP Flags: 包的标识,主要用于状态机的维护
关于TCP Flags的取值,可以扫一眼下面这张图,先注意一下SYN
和FIN
这两值。
TCP Flags of TCP Header
直接讲TCP的状态变换非常生硬,我们穿插在连接建立和断开的过程中来讲,这样比较直观。
从包的发送角度来看,建立连接过程就是三个包发送且到达的过程,如下图:
TCP连接状态图
过程大概是这样(其实图已经非常直观了):
- 准备阶段,B要先监听一个端口,通常服务器