tcp 和 udp 都是属于传输层的协议,它们使用的是相同的网络层 (ip协议)。而它们向应用层提供的服务却不同,tcp 提供的是面向连接,可靠的字节流服务。当客户端和服务器彼此交换数据前,必须先在双方之间建立一个 tcp 连接,之后才能传输数据。udp 是一个简单的面向数据报的运输层协议,udp 不提供可靠性,它只是把应用程序传给 ip 层的数据报发送出去,但是并不能保证它们能到达目的地。
下面就来分析一下 tcp 建立连接的"三次握手"和断开连接的"四次挥手"过程。
目录:
tcp 的报文
三次握手
四次挥手
为什么握手是三次
为什么挥手是四次
-
tcp 的报文
1.1 概念
tcp 报文是 tcp 协议传输的数据单元,也叫作报文段。
1.2 报文格式图
端口号
端口号用来标识同一台计算机的不同的应用进程。
源端口号:源端口和IP地址的作用是标识报文的返回地址。
目的端口号:接收方计算机上的应用程序接口。
tcp 报头中的源端口号和目的端口号协同 ip 数据报中的源 ip 与目的 ip 唯一确定一条 tcp 连接。
序号与确认号
是 tcp 可靠传输的关键部分。
序号:本报文段发送的数据组的第一个字节的序号,在 tcp 传送的流中,每一个字节一个序号。
例如:一个报文段的序号为1,此报文段数据部分共有50字节,则下一个报文段的序号为51,所以序号确保了 tcp 传输的有序性。
确认号:即 Ack,指明下一个期待收到的字节序号,表明该序号之前的所有数据已经正确无误的收到。确认号只有当 ACK 标志为1时才有效。比如建立连接时,SYN 报文的 ACK 标志位为0。
注意:
不要将确认序号Ack与标志位中的ACK搞混了;
确认方 Ack = 发起方 Seq + 1,两端配对。
数据偏移/首部长度 由于首部可能含有可选项内容,因此 tcp 报头的长度是不确定的,报头不包含任何任选字段则长度为20字节,4位首部长度字段所能表示的最大值为1111,转化为10进制为15,15*32/8 = 60,故报头最大长度为60字节。首部长度也叫数据偏移,是因为首部长度实际上指示了数据区在报文段中的起始偏移值。
保留 为将来定义新的用途保留,现在一般置0。
控制位
分为 URG、ACK、PSH、RST、SYN、FIN 6个,每一个标志位表示一个控制功能。
URG:紧急指针标志,为1时表示紧急指针有效,为0则忽略紧急指针。
ACK:确认序号标志,为1时表示确认号有效,为0表示报文中不含确认信息,忽略确认号字段。
PSH:push标志,为1表示是带有push标志的数据,指示接收方在接收到该报文段以后,应尽快将这个报文段交给应用程序,而不是在缓冲区排队。
RST:重置连接标志,用于重置由于主机崩溃或其他原因而出现错误的连接,或者用于拒绝非法的报文段和拒绝连接请求。
SYN:同步序号,用于建立连接过程,在连接请求中,SYN=1 和 ACK=0 表示该数据段没有使用捎带的确认域,而连接应答捎带一个确认,即SYN=1 和 ACK=1。
FIN:finish标志,用于释放连接,为1时表示发送方已经没有数据发送了,即关闭本方数据流。
窗口 滑动窗口大小,用来告知发送端接受端的缓存大小,以此控制发送端发送数据的速率,从而达到流量控制。窗口大小是一个16 bit 字段,因此窗口大小最大为65535。
校验和 奇偶校验,此校验和是对整个的 tcp 报文段,包括 tcp 头部和 tcp 数据,以 16 位字进行计算所得。由发送端计算和存储,并由接收端进行验证。
紧急指针 只有当 URG 标志置 1 时紧急指针才有效。紧急指针是一个正的偏移量,和顺序号字段中的值相加表示紧急数据最后一个字节的序号。 tcp 的紧急方式是发送端向另一端发送紧急数据的一种方式。
选项和填充 最常见的可选字段是最长报文大小,又称为MSS (Maximum Segment Size),每个连接方通常都在通信的第一个报文段 (为建立连接而设置 SYN 标志为1的那个段) 中指明这个选项,它表示本端所能接受的最大报文段的长度。选项长度不一定是32位的整数倍,所以要加填充位,即在这个字段中加入额外的零,以保证 tcp 头是32的整数倍。
数据部分
tcp 报文段中的数据部分是可选的:
在一个连接建立和一个连接终止时,双方交换的报文段只有 tcp 首部;
如果一方没有数据要发送,也使用没有任何数据的首部来确认收到的数据;
在处理超时的许多情况中,也会发送不带任何数据的报文段。
-
三次握手
2.1 概念
所谓三次握手 (Three-Way Handshake) 即建立 tcp 连接,就是指建立一个 tcp 连接时,需要客户端和服务端总共发送3个包以确认连接的建立。在socket 编程中,这一过程由客户端执行 connect 来触发。
2.2 流程图
第一次握手:
Client 将标志位 SYN 置为1,随机产生一个值 Seq=X,并将该数据包发送给 Server,Client 进入 SYN_SENT 状态,等待 Server 确认。
第二次握手:
Server 收到数据包后由标志位 SYN=1 知道 Client 请求建立连接,Server 将标志位 SYN 和 ACK 都置为1,Ack=X+1,随机产生一个值Seq=Y,并将该数据包发送给 Client 以确认连接请求,Server 进入 SYN_RCVD 状态。
第三次握手:
Client 收到确认后,检查 Ack 是否为 X+1,ACK 是否为1,如果正确则将标志位 ACK 置为1,Ack=Y+1,并将该数据包发送给 Server,Server 检查 Ack 是否为 Y+1,ACK是否为1,如果正确则连接建立成功,Client 和 Server 进入 ESTABLISHED 状态,完成三次握手,随后 Client 与 Server 之间可以开始传输数据了。
3. 四次挥手
3.1 概念
四次挥手 (Four-Way Wavehand) 即终止 tcp 连接,就是指断开一个 tcp 连接时,需要客户端和服务端总共发送4个包以确认连接的断开。在 socket 编程中,这一过程由客户端或服务端任一方执行 close 来触发。
由于 tcp 连接是全双工的,因此每个方向都必须要单独进行关闭,这一原则是当一方完成数据发送任务后,发送一个 FIN 来终止这一方向的连接,收到一个 FIN 只是意味着这一方向上没有数据流动了,即不会再收到数据了,但是在这个 tcp 连接上仍然能够发送数据,直到这一方向也发送了 FIN。首先进行关闭的一方将执行主动关闭,而另一方则执行被动关闭。
3.2 流程图
第一次挥手:
Client 发送一个 FIN,用来关闭 Client 到 Server 的数据传送,Client 进入 FIN_WAIT_1 状态。
第二次挥手:
Server 收到 FIN 后,发送一个 ACK 给 Client,确认序号为收到序号+1 (与 SYN 相同,一个 FIN 占用一个序号),Server 进入CLOSE_WAIT 状态。
第三次挥手:
Server 发送一个 FIN,用来关闭 Server 到 Client 的数据传送,Server 进入 LAST_ACK状态。
第四次挥手:
Client 收到 FIN 后,Client 进入 TIME_WAIT 状态,接着发送一个 ACK 给 Server,确认序号为收到序号+1,Server 进入 CLOSED状态,完成四次挥手。
- 为什么握手是三次
首先,我们要知道 tcp 是全双工的,即客户端在给服务器端发送信息的同时,服务器端也可以给客户端发送信息。而半双工的意思是 A 可以给 B 发,B 也可以给 A 发,但是 A 在给 B 发的时候,B 不能给 A 发,即不同时,为半双工。 单工为只能 A 给 B 发,B 不能给 A 发; 或者是只能 B 给 A 发,不能 A 给 B 发。
我们假设 A 和 B 是通信的双方。我理解的握手实际上就是通信,发一次信息就是进行一次握手。
第一次握手: A 给 B 打电话说,你可以听到我说话吗?
第二次握手: B 收到了 A 的信息,然后对 A 说: 我可以听得到你说话啊,你能听得到我说话吗?
第三次握手: A 收到了 B 的信息,然后说可以的,我要给你发信息啦!
在三次握手之后,A 和 B 都能确定这么一件事: 我说的话,你能听到; 你说的话,我也能听到,这样就可以开始正常通信了。
如果两次,那么 B 无法确定 B 的信息 A 是否能收到,所以如果 B 先说话,可能后面的 A 都收不到,会出现问题 。如果四次,那么就造成了浪费,因为在三次结束之后,就已经可以保证 A 可以给 B 发信息,A 可以收到 B 的信息; B 可以给 A 发信息,B 可以收到 A 的信息。
- 为什么挥手是四次
A:“喂,先这样,不说了 (FIN)。” A -> FIN_WAIT1
B: “我知道了 (ACK)。稍等,我还有话说 (传输数据)。” B-> CLOSE_WAIT | A-> FIN_WAIT2
B: “好了,我说完了,我也没什么可说了 (FIN)。” B -> LAST_ACK
A: “我知道了(ACK)。” A -> TIME_WAIT | B -> CLOSED
A 等待 2MSL,保证 B 收到了消息,否则重说一次"我知道了",A -> CLOSED
这样,通过四次挥手,可以把该说的话都说完,并且 A 和 B 都知道自己没话说了,对方也没话说了,然后就挂掉电话(断开链接)了。