TCP全称传输控制协议(Transmission Control Protocol),是传输层的一条可靠地重点协议。
TCP协议段格式
16位的源端口号:标示该进程自己
16位目的端口号:标示我要向哪个进程发送数据
32位的序列号/32位确认序列号:为了满足全双工的安全机制而存在的,它有以下四个功能:
- 保证基本的可靠性
- 是数据可以按序到达
- 支持超时重传
- 高效
4位的首部长度:表示该TCP头部有多少个32位bit,即就是有多少个4字节,TCP头部最大长度15*4=60;
6位的保留位:以备不时之需
6位的标志位:这个就需要详细来说说,因为这个是TCP协议段中最不好记忆的地方 - URG:紧急指针标志位,紧急指针是否有效
- ACK:确认号标志位,确认号是否有效,一般只有第一个报文才会无效,在正常通信期间,其必须有效。
- PSH:推送标志位,催促接收端把接收缓冲区的数据赶紧处理了
- RST:重置标志位,请求重新建立连接
- SYN:同步标志位,请求建立连接
- FIN:结束标志位,通知对方,我要断开连接了
16位的窗口大小:标示我还能接收多少数据,里面填写的也就是我的接收缓冲区的大小
16位的检验和:由发送端填充,CRC校验,若接收端校验不通过就说明数据有问题,此处校验和包括TCP整体(TCP首部和数据)
16位的紧急指针:标示那部分的数据是紧急数据,需要优先处理
40位的选项:这个就有点多了,在这里就不做阐述。
连接管理机制
要详细理解下TCP的三次握手和四次挥手
图中前面一部分是三次握手,后面的是四次挥手
为什么要有三次握手,因为如果只有两次握手的话,当客户端向服务器发生了一个SYN,服务器就会认为连接已经建立成功,但是服务器向客户端发送SYN+ACK如果丢失,客户端就会认为连接建立未成功,这样服务器上就会有许多无效的连接,从而消耗服务器资源,若被黑客利用,就会使服务器异常。而三次握手,若客户端对服务器发生的ACK丢失,就不会影响服务器,只会影响客户端,客户端知道连接未建立成功,就会发送RST,请求服务器重新建立连接。
四次挥手通过双发确认来实现断开连接。在四次挥手中,有一个特殊的状态就是TIME_WAIT,我们可以这样理解它。当客户端跟服务器第三次握手发送ACK时, 若ACK丢失,服务器端就会在一个时间段后重新发送一个FIN,若没有丢失,客户端就一直等到两个服务器端所谓的那一个时间段的时间,发现没有接受到FIN,就说明ACK顺利到达,从而关闭自己。这个所谓的一个时间段称为MSL(报文的最大生存时间),也就是报文从客户端发送到送达服务端的最大时间。TIME_WAIT的时间大小也就是2MSL,在centos7上默认的MSL是60s。但是这样就会又引发一个新问题,当我们断开服务器的时候,刚断开又想重新使用,此时就会显示bind error,绑定错误,这是因为在TIME_WAIT时间里,服务器端并没有关闭,此时它使用的端口还在占用着,就会显示错误,那如何解决这个问题,我们就要使用一个新函数setsockopt。
int opt= 1;
setsockopt(listenfd, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt));
这样就会使端口可以被复用,这段代码要在套接字进行创建的时候使用。
TCP里面还有好多保证可靠性和提高性能的机制,我们在这里先来总体列举下:
提高可靠性:
- 校验和
- 序列号
- 确认应答
- 超时重传
- 连接管理
- 流量控制
- 拥塞控制
提高性能:
- 滑动窗口
- 快速重传
- 延迟应答
- 捎带应答