1、TCP
1.1 TCP 三次握手与四次挥手
1.1.1 TCP的基本认识
TCP的头格式
TCP虽然是面向字节流的,但TCP传送的数据单位却是报文段。一个TCP报文段分为首部和数据两部分,而TCP的全部功能体现在它首部中的各字段的作用。
TCP报文段的前20个字节是固定的,后面4n字节是根据需要而增加的选项。因此TCP首部的最小长度是20字节。
首部固定部分各字段意义:
-
源端口和目的端口(各占2byte):分别写入源端口和目的端口。
-
序号(4byte):序号使用mod232运算,范围为【0,232-1】。TCP是面向字节流的。在一个TCP连接中传送的字节流中的每一个字节都按顺序编号。首部中的序号字段值则是指的是本报文段所发送数据的第一个字节的序号。用来解决网络包乱序问题。
例如,一报文段的序号是301,而接待的数据共有100字节。这就表明:本报文段的数据的第一个字节的序号是301,最后一个字节的序号是400。显然,下一个报文段(如果还有的话)的数据序号应当从401开始,即下一个报文段的序号字段值应为401。这个字段的序号也叫“报文段序号”。
-
确认应答号(4byte):指期望收到对方下一个报文段的第一个数据字节的序号,发送端收到这个确认应答以后可以认为在这个序号以前的数据都已经被正常接收。用来解决不丢包的问题。
例如,B正确收到了A发送过来的一个报文段,其序号字段值是501,而数据长度是200字节(序号501~700),这表明B正确收到了A发送的到序号700为止的数据。因此,B期望收到A的下一个数据序号是701,于是B在发送给A的确认报文段中把确认号置为701。
-
数据偏移(4位):指出TCP报文段的数据起始处距离TCP报文段起始处有多远。这个字段实际上是指出TCP报文段的首部长度。由于首部中还有长度不确定的选项字段,因此数据偏移字段是必要的。数据偏移的单位是32位字(4字节),由于4位二进制数能表示的最大十进制数字是15,因此数据偏移的最大值是4*15=60字节,这也是TCP首部的最大字节(即选项长度不能超过40字节)。
-
保留(6位):保留为今后使用,但目前应置为0 。
-
控制位(各占1位):
-
紧急URG(URGent):当URG=1时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快发送(相当于高优先级的数据)。
例如:已经发送了一个程序要在远地的主机上运行,但后来发现了一些问题,需要取消该程序的运行,因此用户从键盘发出中断命令。如果不使用紧急数据,那么这两个字符将存储在接收TCP的缓存末尾,只有在所有的数据被处理完毕后这两个字符才被交付给接收方的应用进程。当URG=1,发送的应用进程就告诉发送方的TCP有紧急数据要传送。于是发送方TCP就把紧急数据插入到本报文段数据的最前面,而在紧急数据后面的数据仍然是普通数据。这时要与首部中紧急指针(Urgent Pointer)字段配合使用。
-
确认ACK(ACKnowledgment):当ACK = 1时确认号字段才有效。TCP规定,在连接建立后所有传送的报文段都必须把ACK置为1。
-
推送PSH(PuSH):当两个应用进程进行交互式通信时,有时一端的应用进程希望在键入一个命令后立即就能收到对方的响应。在这种情况下,TCP就可以使用推送(push)操作。这时,发送方TCP把PSH置为1,并立即创建一个报文段发送出去。接收方TCP收到PSH=1的报文段,就尽快地交付接收应用进程。而不用等到整个缓存都填满后再向上交付。
-
复位RST(ReSeT):当RST=1时,表明TCP连接中出现了严重错误(如由于主机崩溃或其他原因),必须释放连接,然后再重新建立连接。RST置为1还用来拒绝一个非法的报文段或拒绝打开一个连接。
-
同步SYN(SYNchronization):用来建立连接。当SYN=1而ACK=0时,表明这是一个连接请求报文段。对方若同意建立连接,则应在响应的报文段中使SYN=1和ACK=1,因此SYN=1就表示这是一个连接请求或连接接受报文。
-
终止FIN(FINis):用来释放一个连接。当FIN=1时,表明此报文段的发送发的数据已发送完毕,并要求释放运输连接。
-
-
窗口(2byte):窗口指的是发送本报文段的一方的接受窗口(而不是自己的发送窗口)。窗口值是【0,2^16-1】之间的整数。窗口值告诉对方:从本报文段首部中的确认号算起,接收方目前允许对方发送的数据量(以字节为单位)。之所以要有这个限制,是因为接收方的数据缓存空间是有限的。总之,窗口值作为接收方让发送方设置其发送窗口的依据。窗口字段明确指出了现在允许对方发送的数据量。窗口值经常在动态变化。
例如,发送了一个报文段,其确认号是701,窗口字段是1000,这就是告诉对方:“从701算起,我(即发送方报文段的一方)的接收缓存空间还可接受1000个字节数据(字节序号是701~1700),你在给我发数据时,必须考虑到这一点。”
-
检验和(2byte):检验和目的是为了发现TCP首部和数据在发送端到接收端之间发生的任何改动。如果接收方检测到检验和有差错,则TCP段会被直接丢弃。和UDP用户数据报一样,在计算检验和时,要在TCP报文段的前面加上12字节的伪首部。伪首部的格式和UDP用户数据报的伪首部一样。但应把伪首部第4个字段中的17改为6(TCP的协议号是6);把第5字段中的UDP中的长度改为TCP长度。接收方收到此报文段后,仍要加上这个伪首部来计算检验和。若使用TPv6,则相应的伪首部也要改变。
-
紧急指针(2byte):紧急指针仅在URG=1时才有意义,它指出本报文段中紧急数据的字节数。因此,在紧急指针指出了紧急数据的末尾在报文段中的位置。当所有紧急数据都处理完时,TCP就告诉应用程序恢复到正常操作。即使窗口为0时也可以发送紧急数据。
-
选项:长度可变,最长可达40字节。当没有使用选项时,TCP的首部长度是20字节。
-
最大报文段长度MSS(Maximum Segment Szie): MSS是每一个TCP报文段中的数据字段的最大长度。TCP最初只规定了这一种选项。
数据字段长度=TCP报文段长度-TCP首部长度
我们知道,TCP报文段的数据部分,至少要加上40字节的首部(TCP首部20字节和IP首部20字节,这里还没有考虑首部中的可选部分)才能组装成一个IP数据报。若选择较小的MSS长度,网络的利用率就降低。设想在极端情况下,当TCP报文段只含有1字节的数据时,在IP层传输的数据报的开销至少有40字节。这样,对网络的利用率就不会超过1/41。到了数据链路层还要加上一些开销。但反过来,若TCP报文段非常长,那么在IP层传输时就有可能要分解成多个短数据报片。在终点要把收到的各个短数据报片组成成原来的TCP报文段,当传输出错时还要进行重传,这些也都会使开销增大。因此,MSS应尽可能大些,只要在IP层传输时不需要分片就行。由于IP数据报所经历的路径是动态变化的,因此在这条路径上确定的不需要分片的MSS,如果改走另一条路径就可能需要进行分片。因此最佳的MSS是很难确定的。在连接过程中,双方都把自己能够支持的MSS写入这一字段,以后就按照这个数值传输数据,两个传送方向可以有不同的MSS值。若主机未填写这一项,则MSS的默认值是536字节长。因此,所有在互联网上的主机都应该接受的报文段长度是536+20(固定首部长度)=556字节。
-
扩大窗口选项(3byte):为了扩大窗口。TCP首部中窗口字段长度是16位,因此最大的窗口大小为64K字节,要获得高吞吐量需要更大的窗口大小。
窗口扩大选项占3字节,其中有一个字节表示移位值S。新的窗口值等于TCP首部中的窗口位数从16增大到(16+S)。移位值允许使用的最大值是14,相当于窗口最大值增大到2(16+14)-1=230-1。
窗口扩大选项可以在双方初始建立TCP连接时进行协商。如果连接的某一端实现了窗口扩大,当它不再需要扩大其窗口时,可发送S=0选项,使窗口大小回到16。
-
时间戳选项(10byte):其中最主要的字段是时间戳字段(4字节)和时间戳回送回答字段(4字节)。
- 用来计算往返时间RTT。发送方在发送报文段时把当前时钟的时间值放入时间戳字段,接收方在确认该报文段后把时间戳字段复制到时间戳回送回答字段。因此,发送方在收到确认报文后,可以准确地计算出RTT来。
- **用于处理TCP序号超过232的情况,这又称为防止序号绕回PAWS**。TCP报文段的序号只有32位,而每增加232个序号就会重复使用原来用过的序号。当使用高速网络时,在一次TCP连接的数据传送中序号很可能被重复使用。例如,当使用1.5Mbit/s的速度发送报文段时,序号重复要6小时以上。但若用2.5Gbit/s的速率发送报文段,则不到14秒钟序号就会重复。为了使接收方能够把新的报文段和迟到很久的报文段区分开,则可以在报文段中加上这种时间戳。
-
UDP的头格式
- 目标和源端口:主要是告诉 UDP 协议应该把报文发给哪个进程。
- 报文长度:该字段保存了 UDP 首部和数据的长度之和。
- 校验和:校验和是为了提供可靠的 UDP 首部和数据而设计。
UDP伪首部
- 伪首部的消失:发送方将计算完毕的校验和填入首部的检验和字段后,去除伪首部发送UDP报文
- 作用:为了计算校验和
为什么需要TCP协议?TCP工作在哪一层?
IP 层是不可靠的,它不保证网络包的交付、不保证网络包的按序交付、也不保证网络包中数据的完整性。如果需要保障网络数据包的可靠性,那么就需要由上层(传输层)的 TCP 协议来负责。因为 TCP 是⼀个工作在传输层的可靠数据传输的服务,它能确保接收端接收的网络包是无损坏、无间隔、非冗余和按序的。
什么是TCP?
TCP(Transmission Control Protocol)是面向连接的、可靠的、基于字节流的传输层通信协议。
- 面向连接:⼀定是⼀对⼀才能连接
- 可靠的:无论网络链路中出现了怎样的链路变化,TCP 都可以保证报文⼀定能够到达接收端
- 字节流:消息是没有边界的,所以无论我们消息多大都可以进行传输。并且消息是有序的,当前一个消息没有收到之前,即使它先收到了后面的消息,那么也不能扔给应用层去处理,同时对重复的报文会自动丢弃。
什么是TCP连接?
用于保证可靠性和流量控制维护的某些状态信息称为连接,这些信息的组合包括Socket、序列号和窗口大小。
建立⼀个TCP连接是需要客户端与服务器端达成上述三个信息的共识
- Socket:由IP地址和端口号组成
- 序列号:用来解决乱序问题等
- 窗口大小:用来做流量控制
如何唯一确定一个TCP连接?
TCP 四元组可以唯⼀的确定⼀个连接。
- 源地址
- 源端口
- 目标地址
- 目标端口
源地址和目的地址的字段(32位)是在 IP 头部中,作用是通过 IP 协议发送报文给对方主机。
源端口和目的端口的字段(16位)是在 TCP 头部中,作用是告诉 TCP 协议应该把报文发给哪个进程。
TCP和UDP的区别
- 连接
- TCP是面向连接的传输层协议,传输数据前先要建立连接
- UDP是不需要连接,即刻传输数据
- 服务对象
- TCP是一对一的两点服务,即一条连接只有两个端点
- UDP 支持一对一、一对多、多对多的交互通信
- 可靠性
- TCP 是可靠交付数据的,数据可以无差错、不丢失、不重复、按需到达。
- UDP 是尽最大努力交付,但不保证可靠交付数据。
- 拥塞控制、流量控制
- TCP 有拥塞控制和流量控制机制,保证数据传输的安全性。
- UDP 则没有,即使网络非常拥堵了,也不会影响 UDP 的发送速率。
- 首部开销
- TCP 首部长度较长,会有一定的开销。首部在没有使用选项字段时是20 个字节,如果使用了选项字段则会变长的。
- UDP 首部只有8个字节,并且是固定不变的,开销较小。
- 传输方式
- TCP是流式传输,没有边界,但保证顺序和可靠
- UDP是一个包一个包的发送,是有边界的,但可能会丢包和乱序
TCP和UDP的特点
- 传输控制协议TCP(Transmission Control Protocol)是面向连接的,提供可靠交付,有流量控制,拥塞控制,提供全双工通信,面向字节流(把应用层传下来的报文看成字节流,把字节流组织成大小不等的数据块),每一条 TCP 连接只能是点对点的(一对一)。
- 用户数据报协议UDP(User Datagram Pro