TCP/IP协议是互联网重要的基础协议,掌握该协议的原理对于我们理解数据的传输过程会有很大的帮助,首先来了解一下OSI的七层模型:
TCP协议工作在OSI七层模型的第四层——Transport层,IP工作在第三层——Network层,ARP工作在第二层——Data Link层。数据在上三层会被封装为PDU单元,在传输层会被封装为Segment(数据段),在网络层会被封装为Packet(包),在数据链路层会被封装为Frame(帧),在物理层被转换为比特流进行数据的传送,每一层下来都要加上头部信息,进行数据封装,对方接受数据后,从下到上一层层剥离头部信息,最终获取数据包中的数据,这个过程和俄罗斯的套娃比较类似,这就是数据的封装与解封装,也是数据传输过程的基本流程,每一层的作用和对应的协议如下:
TCP作为一种协议,存在自己的报文格式,如下图:
上图就是TCP头部的报文格式,各个字段的代表含义如下:
1.Source Port(源端口号)和Destination Port(目的端口号):分别占用16位,表示源端口号和目的端口号;用于区别主机中的不同进程,而IP地址是用来区分不同的主机的,源端口号和目的端口号配合上IP首部中的源IP地址和目的IP地址就能唯一的确定一个TCP连接;
2.Sequence Number(序列号):占用32字节。用来标识从TCP发端向TCP接收端发送的数据字节流,它表示在这个报文段中的的第一个数据字节在数据流中的序号;主要用来解决网络包乱序的问题,提供有序的传输过程;
3.Acknowledgment Number(ack确认号):32位确认序列号包含发送确认的一端所期望收到的下一个序号,因此,确认序号应当是上次已成功收到数据字节序号加1。不过,只有当标志位中的ACK标志(下面介绍)为1时该确认序列号的字段才有效。主要用来解决不丢包的问题;
4.Offset(数据偏移):给出首部中32 bit字的数目,需要这个值是因为任选字段的长度是可变的。这个字段占4bit(最多能表示15个32bit的的字,即4*15=60个字节的首部长度),因此TCP最多有60字节的首部。然而,没有任选字段,正常的长度是20字节;
5.TCP Flags(TCP标志位):TCP首部中有6个标志比特,它们中的多个可同时被设置为1,主要是用于操控TCP的状态机的,依次为URG
,ACK
,PSH
,RST
,SYN
,FIN
。每个标志位的意思如下:
(1) URG:此标志表示TCP包的紧急指针域(后面马上就要说到)有效,用来保证TCP连接不被中断,并且督促中间层设备要尽快处理这些数据;
(2) ACK:此标志表示应答域有效,就是说前面所说的TCP应答号将会包含在TCP数据包中;有两个取值:0和1,为1的时候表示应答域有效,反之为0;
(3) PSH:这个标志位表示Push操作。所谓Push操作就是指在数据包到达接收端以后,立即传送给应用程序,而不是在缓冲区中排队;
(4) RST:这个标志表示连接复位请求。用来复位那些产生错误的连接,也被用来拒绝错误和非法的数据包;
(5) SYN:表示同步序号,用来建立连接。SYN
标志位和ACK
标志位搭配使用,当连接请求的时候,SYN
=1,ACK
=0;连接被响应的时候,SYN
=1,ACK
=1;这个标志的数据包经常被用来进行端口扫描。扫描者发送一个只有SYN
的数据包,如果对方主机响应了一个数据包回来 ,就表明这台主机存在这个端口;但是由于这种扫描方式只是进行TCP三次握手的第一次握手,因此这种扫描的成功表示被扫描的机器不很安全,一台安全的主机将会强制要求一个连接严格的进行TCP的三次握手;
(6) FIN: 表示发送端已经达到数据末尾,也就是说双方的数据传送完成,没有数据可以传送了,发送FIN
标志位的TCP数据包后,表示通知对方本端要关闭连接。
6.Window:窗口大小,也就是有名的滑动窗口,用来进行流量控制。
TCP三次握手的连接过程,可以用下图进行分解:
以上为TCP三次握手的连接过程,也可以用下图形象的表示一下:
链路在建立之前会进行三次握手进行,在确认没有问题之后才会建立连接。三个握手过程如下:
第一次握手:建立连接。客户端发送连接请求报文段,将SYN
位置为1,Sequence Number
为x;然后,客户端进入SYN_SEND
状态,等待服务器的确认;
第二次握手:服务器收到SYN
报文段。服务器收到客户端的SYN
报文段,需要对这个SYN
报文段进行确认,设置Acknowledgment Number
为x+1(Sequence Number
+1);同时,自己自己还要发送SYN
请求信息,将SYN
位置为1,Sequence Number
为y;服务器端将上述所有信息放到一个报文段(即SYN+ACK
报文段)中,一并发送给客户端,此时服务器进入SYN_RECV
状态;
第三次握手:客户端收到服务器的SYN+ACK
报文段。然后将Acknowledgment Number
设置为y+1,向服务器发送ACK
报文段,这个报文段发送完毕以后,客户端和服务器端都进入ESTABLISHED
状态,完成TCP三次握手。
三次握手完成后,主机之间开始进行数据传输。
TCP的四次挥手过程是怎样的呢?如下图所示:
第一次分手:主机A(可以使客户端,也可以是服务器端),设置Sequence Number和Acknowledgment Number,向主机B发送一个FIN报文段;此时,主机A进入FIN_WAIT_1状态;这表示主机A没有数据要发送给主机B了;
第二次分手:主机B收到了主机A发送的FIN报文段,向主机A回一个ACK报文段,Acknowledgment Number为Sequence Number加1;主机A进入FIN_WAIT_2状态;主机B告诉主机A,我已经知道你没有数据要发送了;
第三次分手:主机B向主机A发送FIN报文段,请求关闭连接,同时主机B进入CLOSE_WAIT状态;
第四次分手:主机A收到主机B发送的FIN报文段,向主机B发送ACK报文段,然后主机A进入TIME_WAIT状态;主机B收到主机A的ACK报文段以后,就关闭连接;此时,主机A等待2MSL后依然没有收到回复,则证明Server端已正常关闭,那好,主机A也可以关闭连接了。
看完上面,会存在以下疑问:
1,为什么需要三次握手?
主要为了防止已失效的连接请求报文段突然又传送到了B,因而产生错误.如A发出连接请求,但因连接请求报文丢失而未收到确认,于是A再重传一次连接请求。后来收到了确认,建立了连接。数据传输完毕后,就释放了连接,A工发出了两个连接请求报文段,其中第一个丢失,第二个到达了B,但是第一个丢失的报文段只是在某些网络结点长时间滞留了,延误到连接释放以后的某个时间才到达B,此时B误认为A又发出一次新的连接请求,于是就向A发出确认报文段,同意建立连接,不采用三次握手,只要B发出确认,就建立新的连接了,此时A不理睬B的确认且不发送数据,则B一致等待A发送数据,浪费资源。
2,为什么要进行四次分手?
TCP是双向的,所以需要在两个方向分别关闭,每个方向的关闭又需要请求和确认,所以一共就4次。同时还存在以下因素:
- 确保数据能够完整传输。
- 当被动方收到主动方的FIN报文通知时,它仅仅表示主动方没有数据再发送给被动方了。
- 但未必被动方所有的数据都完整的发送给了主动方,所以被动方不会马上关闭SOCKET,它可能还需要发送一些数据给主动方后,再发送FIN报文给主动方,告诉主动方同意关闭连接,所以这里的ACK报文和FIN报文多数情况下都是分开发送的
以上是对TCP三次握手和四次挥手过程的理解,TCP过程总体较为复杂,还需要在以后慢慢总结体会。