TCP协议详解
TCP/IP协议不是TCP和IP这两个协议的合称,而是指因特网整个使用TCP/IP协议的协议集合。他取代了OSI七层模型,成为事实上的应用于实际的模型。
TCP/IP协议与OSI协议的关系如下:
各层的作用如下:
TCP特性:
工作在传输层面向连接协议
全双工协议
半关闭
错误检查
将数据打包成段,排序
确认机制
数据恢复,重传
流量控制,滑动窗口
拥塞控制,慢启动和拥塞避免算法
补充:TCP是一种面向连接的,可靠的传输层协议;全双工代表可以双向连同;TCP协议建立在不可靠的网络层IP协议之上,IP不能提供任何可靠性机制,TCP的可靠性完全由自己实现,TCP采用的最基本的可靠性技术是确认与超时重传和流量控制;
TCP包头:
下面是包头内容的解释:
源端口、目标端口:计算机上的进程要和其他进程通信是要通过计算机端口的,而一个计算机端口某个时刻只能被一个进程占用,所以通过指定源端口和目标端口,就可以知道是哪两个进程需要通信。源端口、目标端口是用16位表示的,可推算计算机的端口个数为2^16个。
序列号:表示本报文段所发送数据的第一个字节的编号。在TCP连接中所传送的字节流的每一个字节都会按顺序编号。由于序列号由32位表示,所以每2^32个字节,就会出现序列号回绕,再次从0开始。
确认号:表示接收方期望收到发送方下一个报文段的第一个字节数据的编号。也就是告诉发送方:我希望你下次发送的数据的第一个字节数据的编号是这个确认号。
数据偏移:表示TCP报文段的首部长度,共4位,由于TCP首部包含一个长度可变的选项部分,需要指定这个TCP报文段到底有多长。它指出TCP报文段的数据起始处距离TCP报文段的起始处有多远。该字段的单位是32位(即4个字节为计算单位),4位二进制最大表示15,所以数据偏移也就是TCP首部最大60字节。
URG:表示本报文段中发送的数据是否包含紧急数据。后面的紧急指针字段(urgent pointer)只有当URG=1时才有效。
ACK:表示是否前面的确认号字段是否有效。ACK=1,表示有效。只有当ACK=1时,前面的确认号字段才有效。TCP规定,连接建立后,ACK必须为1,带ACK标志的TCP报文段称为确认报文段。
PSH:提示接收端应用程序应该立即从TCP接收缓冲区中读取数据,为接收后续数据腾出空间。如果为1,则表示对方应当立即把数据提交给上层应用,而不是缓存起来,如果应用程序不将接收到的数据读取,就会一直停留在TCP接收缓冲区中
PST:如果收到一个RST=1的报文,说明与主机的连接出现了严重错误(如主机崩溃),必须释放连接,然后重新建立连接。或者说明上次发送给主机的数据有问题,主机拒绝响应,带RST标志的TCP报文段称为复位报文段。
SYN:在建立连接时使用,用来同步序号。当SYN=1,ACK=0时,表示这是一个请求建立连接的报文段;当SYN=1,ACK=1时,表示对方同意建立连接。SYN=1,ACK=1时,表示对方同意建立连接。SYN=1,说明这是一个请求建立连接或同意建立连接的报文。只有在前两次握手中SYN才置为1,带SYN标志的TCP报文段称为同步报文段。
FIN:表示通知对方本端要关闭连接了,标记数据是否发送完毕。如果FIN=1,即告诉对方:“我的数据已经发送完毕,你可以释放连接了”,带FIN标志的TCP报文段称为结束报文段。
窗口大小: 表示现在允许对方发送的数据量,也就是告诉对方,从本报文段的确认号开始允许对方发送的数据量。
校验和:提供额外的可靠性。
紧急指针:标记紧急数据在数据字段中的位置。
选项部分:其最大长度可根据TCP首部长度进行推算。TCP首部长度用4位表示,选项部分最长为:(2^4-1)*4-20=40字节。
常见选项:
最大报文段长度
窗口扩大
时间戳
TCP端口:
如果把IP地址比作一间房子,端口就是出入这间房子的门。真正的房子只有几个门,但是一个IP地址的端口可以 有65535个之多。端口号号只有整数,从0到65535。
在这65535个端口之中:
0-1023:被永久的分配给固定的系统应用使用,如:
22/tcp(ssh), 80/tcp(http), 443/tcp(https)
1024-49151: 被用于用户端口或注册端口,但要求并不严格,分配给程序注册为某应用使用
包括:1433/tcp(SqlServer),1521/tcp(oracle), 3306/tcp(mysql), 11211/tcp/udp(memcached)
49152-65535: 动态端口或私有端口,客户端程序随机使用的端口
客户端用户可用的端口号随机范围:
现在重点讲一下,TCP的三次握手,四次挥手:
三次握手,指的是通过两台要相连的主机互相发送消息,来确认连接。他们的连接过程相当于:
甲方:我能连接你吧?
我听到你的话了,你能连接我:乙方
甲方:好的,那我连接你了
这样三次相互发消息之后,双方就可以建立连接了。
图解:
CLOSED: 没有任何连接状态
LISTEN: 侦听状态,等待来自远方TCP端口的连接请求
SYN-SENT:在发送连接请求后,等待对方确认
SYN-RECEIVED:在收到和发送一个连接请求后,等待对方确认
ESTABLISHED:代表传输连接建立,双方进入数据传送状态
四次挥手,代表正在建立连接的两台主机,由其中一台先发出断连消息,另外一台确定。其过程包手4次收发。
图解,当客户机发出断连消息,并发送FIN=1,seq=u的数据包,FIN意味着分手。服务器端收到消息后发送ACK=1,seq=v,ack=u+1,ACK表示确认收到了客户机发的消息,同时发送FIN=1,ACK=1,seq=w,ack=u+1,表示确认分手。这时客户机收到消息,再次向服务器发送ACK=1,seq=u+1,ack=w+1,向服务器表示我(指客户机)收到了确认分手的消息,这个过程所用的时间是大约两分钟。
ESTABLISHED:代表传输连接建立,双方进入数据传送状态
FIN-WAIT-1:主动关闭,主机已发送关闭连接请求,等待对方确认
FIN-WAIT-2:主动关闭,主机已收到对方关闭传输连接确认,等待对方发送关闭传输连接请求
TIME-WAIT:完成双向传输连接关闭,等待所有分组消失
CLOSE-WAIT:被动关闭,等待最后一个关闭传输连接确认,并等待所有分组消失
CLOSING:双方同时尝试关闭传输连接,等待对方确认
有限状态机:
客户端发送FIN给服务端时,自己进入了FIN_WAIT_1状态,这时等待接收服务端的报文,该报文会有三种可能:
1.只有服务端的ACK。只收到服务器的ACK,客户端会进入FIN_WAIT_2状态,当收到FIN时,才会给服务器端发送一个确认收到的ACK,然后进入TIME_WAIT状态。这个状态会持续2MSL。
2.只有服务器端的FIN时,回应一个ACK给服务端,进入CLOSING状态,然后接收到服务端的ACK时,进入TIME_WAIT状态
3.同时收到服务端的ACK和FIN,直接进入TIME_WAIT状态。
可以由下图表示:
客户端的典型状态转移:
客户端通过connect系统调用主动与服务器建立连接connect系统调用首先给服务器发送一个同步报文段,使连接转移到SYN_SENT状态。此后connect系统调用可能因为如下两个原因失败返回:
1. 如果connect连接的目标端口不存在(未被任何进程监听),或者该端口仍被牌TIME_WAIT状态的连接所占用,则服务器将给客户端发送一个复位报文段,connect调用失败。
2. 如果目标端口存在,但connect在超时时间内未收到服务器的确认报文段,则connect调用失败。
Connect调用失败将使连接立即返回到初始的CLOSED状态。如果客户端成功收到服务器的同步报文段和确认,则connect调用成功返回,连接转移至ESTABLISHED状态
孤儿连接:导致产生孤儿连接的,是发送的一方长时间收不到接收方发送的消息,一直停留在一个状态下。这容易消耗资源,所以系统定义两个参数来防止过多的孤儿连接拖累系统:
/proc/sys/net/ipv4/tcp_max_orphans 指定内核能接管的孤儿连接数目
/proc/sys/net/ipv4/tcp_fin_timeout 指定孤儿连接在内核中生存的时间
TCP超时重传:
当网络出现异常状况时,在发送信息的过程中容易出现超时或丢包的情况。TCP服务则注重解决这一问题。
TCP服务必须能够重传超时时间内未收到确认的TCP报文段。为此,TCP模块为每个TCP报文段都维护一个重传定时器,该定时器在TCP报文段第一次被发送时启动,如果超时时间内未收到接收方的应答,TCP模块将重传TCP报文段并重置定时器。至于下次重传的超时时间如何选择,以及最多执行多少次重传,就是TCP的重传策略
与TCP超时重传相关的两个内核参数:
/proc/sys/net/ipv4/tcp_retries1, 指定在底层IP接管之前TCP最少执行的重传次数,默认值是3.
/proc/sys/net/ipv4/tcp_retries2, 指定连接放弃前TCP最多可以执行的重传次数,默认值15(一般对应13~30min)
TCP端口号:
源端口(Sorce Port)在前,目标端口(Dest Port)在后。
原创文章,作者:xxcj,如若转载,请注明出处:http://www.178linux.com/86043