计算机网络原理（TCP/IP协议）

最新推荐文章于 2024-01-28 21:30:17 发布

DU777DU

最新推荐文章于 2024-01-28 21:30:17 发布

阅读量798

点赞数 1

分类专栏：计算机网络原理文章标签： java 网络协议 tcp/ip 计算机网络

本文链接：https://blog.csdn.net/qq_55996124/article/details/119573795

版权

计算机网络原理专栏收录该内容

4 篇文章 4 订阅

订阅专栏

1. 应用层

2. 传输层

(传输层和网络层是操作系统内核实现好的.普通程序猿不能修改)

核心功能：完成"端对端"的数据传输

传输层协议有很多~~最常用的有两个:UDP/TCP

2.1 UDP协议

UDP协议端格式：

16位UDP长度, 表示整个数据报(UDP首部+UDP数据)的最大长度

如果校验和出错, 就会直接丢弃

2.1.1 UDP的特点

a）无连接: 知道对端的IP和端口号就直接进行传输, 不需要建立连接

b）不可靠: 没有确认机制, 没有重传机制; 如果因为网络故障该段无法发到对方, UDP协议层也不会给应用层返回任何错误信息

c）面向数据报: 不能够灵活的控制读写数据的次数和数量

面向数据报

应用层交给UDP多长的报文, UDP原样发送, 既不会拆分, 也不会合并;

用UDP传输100个字节的数据: 如果发送端调用一次sendto, 发送100个字节, 那么接收端也必须调用对应的一次recvfrom, 接收100个字节; 而不能循环调用10次recvfrom, 每次接收10个字节

UDP的缓冲区

UDP没有真正意义上的发送缓冲区. 调用sendto会直接交给内核, 由内核将数据传给网络层协议进行后续的传输动作

UDP具有接收缓冲区. 但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致; 如果缓冲区满了, 再到达的UDP数据就会被丢弃

UDP的socket既能读, 也能写, 这个概念叫做全双工

UDP使用注意事项

我们注意到, UDP协议首部中有一个16位的最大长度. 也就是说一个UDP能传输的数据最大长度是64K(包含UDP首部). 然而64K在当今的互联网环境下, 是一个非常小的数字. 如果我们需要传输的数据超过64K, 就需要在应用层手动的分包, 多次发送, 并在接收端手动拼装

2.2 TCP协议

TCP全称为 "传输控制协议(Transmission Control Protocol"). 人如其名, 要对数据的传输进行一个详细的控制

TCP协议段格式：

4位TCP报头长度:

表示该TCP头部有多少个32位bit(有多少个4字节); 所以TCP头部最大长度是15 * 4 = 60

6位标志位:

URG: 紧急指针是否有效

ACK: 确认号是否有效

PSH: 提示接收端应用程序立刻从TCP缓冲区把数据读走

RST: 对方要求重新建立连接; 我们把携带RST标识的称为复位报文段

SYN: 请求建立连接; 我们把携带SYN标识的称为同步报文段

FIN: 通知对方, 本端要关闭了, 我们称携带FIN标识的为结束报文段

16位校验和:

发送端填充, CRC校验. 接收端校验不通过, 则认为数据有问题. 此处的检验和不光包含 TCP首部, 也包含TCP数据部分

16位紧急指针:

标识哪部分数据是紧急数据

3. TCP协议的主要机制

3.1 确认应答(ACK)机制

TCP将每个字节的数据都进行了编号. 即为序列号

每一个ACK都带有对应的确认序列号, 意思是告诉发送者, 我已经收到了哪些数据; 下一次你从哪里开始发

确认序号在TCP中是有特定含义的~

表示接下来想要的下一条数据编号是啥.而不是收到的数据编号是啥~

(这样的设定是非常有用的)

发送方收到应答数据的时候.应答报文中的确认序号为1001,此时发送方就知道了, 1-1000的数据已经顺利抵达.并且接下来要发送的数据就是从1001开始~

3.2 超时重传机制

若回应丢包，那么发送方就会继续发送数据，会造成数据重复

TCP自身已经处理好了这种数据重复的情况

1. TCP有一一个"接受缓冲区" (一块内存)

TCP就会检查缓冲区中有没有重复的数据~根据序号就能去重

2. 超时重传等待的时间间隔，不是固定的,而是逐渐变大的

假设丢包的概率是固定值，此时连续丢包的概率其实是比较小的

一旦真的出现连续丢包，大概率是网络出现了彻底的问题(网线断开)因此, TCP重传的时间间隔，就会越来越高~频率就会越来越低

重传到一定的次数就会尝试断开连接~

Linux中(BSD Unix和Windows也是如此), 超时以500ms为一个单位进行控制, 每次判定超时重发的超时时间都是500ms的整数倍

如果重发一次之后, 仍然得不到应答, 等待 2*500ms 后再进行重传

如果仍然得不到应答, 等待 4*500ms 进行重传. 依次类推, 以指数形式递增

累计到一定的重传次数, TCP认为网络或者对端主机出现异常, 强制关闭连接

3.3 连接管理机制

在正常情况下, TCP要经过三次握手建立连接, 四次挥手断开连接

三次握手：

三次握手的本质，其实是确认通信双方,发送能力和接受能力都正常

举例理解：

真实情况：

四次挥手：

断开连接时,主机B给主机A回复的FIN和ACK能否合并在一起呢?

不一定~~可能能合并,也可能不会合并

不会合并的理由是发送ACK和FIN的时机是不一样的.发送ACK是操作系统内核的行为.在收到FIN的第一时间,回复ACK，发送FIN是应用程序的行为.在代码中执行到对应的"close()" 才会触发FIN

会合并的理由是如果close能够很快被调用到，(FIN和ACK的时间间隔不是很长的时候就会触发TCP的"延时应答+捎带应答"机制~~)

其实在三次握手和四次挥手之间也会涉及到"确认应答和超时重传"

3.4 TCP协议中的状态

TCP协议是有“状态”，重点理解TCP中的一些核心的状态

1. ESTABLISHED连接成功,可以进行后续通信了.好比打电话，拨号拨通了一样~

2. LISTEN服务器端进入的状态.服务器准备就绪,允许客户端随时来建立连接~~好比手机开机信号良好,随时可以有人来打电话~

3. CLOSE_ WAIT可以理解成一个断开连接时的中间状态.这个状态正常情况下存在时间较短.出现在,收到FIN,返回ACK,到发送FIN这个时间间隙中.一般看到这个状态的时候,多半是代码出bug了,导致没有及时调用到close方法~~

4. TIME_ WAIT也是断开连接时的状态~

3.5 滑动窗口机制

确认应答策略, 对每一个发送的数据段, 都要给一个ACK确认应答. 收到ACK后再发送下一个数据段. 这样做有一个比较大的缺点, 就是性能较差. 尤其是数据往返的时间较长的时候

既然这样一发一收的方式性能较低, 那么我们一次发送多条数据, 就可以大大的提高性能(其实是将多个段的等待时间重叠在一起了)

a）窗口大小指的是无需等待确认应答而可以继续发送数据的最大值. 上图的窗口大小就是4000 个字节(四个段)

b）发送前四个段的时候, 不需要等待任何ACK, 直接发送

c）收到第一个ACK后, 滑动窗口向后移动, 继续发送第五个段的数据; 依次类推

d）操作系统内核为了维护这个滑动窗口, 需要开辟发送缓冲区来记录当前还有哪些数据没有应答; 只有确认应答过的数据比特科技 , 才能从缓冲区删掉

e）窗口越大, 则网络的吞吐率就越高;

窗口范围内的数据就是已经发出去的数据，同时也是要等待ACK的数据.随着对方的ACK的到达，要等待的数据也就随之发送变化.同时也会发送新的数据出去

看起来就好像"窗口滑了一个格子一样"

那么如果出现了丢包, 如何进行重传? 这里分两种情况讨论

情况一: 数据包已经抵达, ACK被丢了

这种情况下, 部分ACK丢了并不要紧, 因为可以通过后续的ACK进行确认

情况二: 数据包就直接丢了

当某一段报文段丢失之后, 发送端会一直收到 1001 这样的ACK, 就像是在提醒发送端 "我想要的是 1001" 一样

如果发送端主机连续三次收到了同样一个 "1001" 这样的应答, 就会将对应的数据 1001 - 2000 重新发送

这个时候接收端收到了 1001 之后, 再次返回的ACK就是7001了(因为2001 - 7000)接收端其实之前就已经收到了, 被放到了接收端操作系统内核的接收缓冲区中

如果连续两个包都丢了呢？

这里的重传机制，是比较精妙的~~得益于确认序号的设计

保证了传输的效率是比较高的

重传的效率也是比较高的(没有重传多余的数据)

这种机制被称为 "高速重发控制"(也叫 "快重传")

限制的方法就是流量控制

3.6 流量控制

接收端处理数据的速度是有限的. 如果发送端发的太快, 导致接收端的缓冲区被打满, 这个时候如果发送端继续发送, 就会造成丢包, 继而引起丢包重传等等一系列连锁反应

因此TCP支持根据接收端的处理能力, 来决定发送端的发送速度. 这个机制就叫做流量控制(Flow Control)

a）接收端将自己可以接收的缓冲区大小放入 TCP 首部中的 "窗口大小" 字段, 通过ACK端通知发送端

b）窗口大小字段越大, 说明网络的吞吐量越高

c）接收端一旦发现自己的缓冲区快满了, 就会将窗口大小设置成一个更小的值通知给发送端

d）发送端接受到这个窗口之后, 就会减慢自己的发送速度

e）如果接收端缓冲区满了, 就会将窗口置为0; 这时发送方不再发送数据, 但是需要定期发送一个窗口探测数据段, 使接收端把窗口大小告诉发送端

流量控制的目的是为了让发送方的速率和接收方的速率尽可能一致

步调一致,才能做到可靠的同时尽量高效

在ACK报文中,告诉发送方，接收方的接受缓冲区的空闲空间

根据这个大小，发送方来决定接下来按照多大的窗口来传输速度~

3.7 拥塞控制

滑动窗口的大小由拥塞控制+流量控制. 一起决定的

虽然TCP有了滑动窗口这个大杀器, 能够高效可靠的发送大量的数据. 但是如果在刚开始阶段就发送大量的数据, 仍然可能引发问题

由于网络环境比较复杂,也不知道中间经历了多少节点~~

所以发送方会采取一个动态变化的过程,来试探出当前的窗口大小多少合适

发送方会在初始情况下,设置一个比较小的 "窗口大小" (慢开始)发一下数据试试，如果没丢包~,说明网络畅通.就开始尝试一个更大的窗口大小~ ,如果还没丢包,网络还是畅通，继续尝试一个更大的窗口大小~~直到出现丢包了,缩小窗口大小循环上述过程~~

滑动窗口的实际大小，就是拥塞窗口和流量控制窗口的较小值

拥塞窗口增长速度, 是指数级别的. "慢启动" 只是指初使时慢, 但是增长速度非常快

为了不增长的那么快, 因此不能使拥塞窗口单纯的加倍. 此处引入一个叫做慢启动的阈值

当拥塞窗口超过这个阈值的时候, 不再按照指数方式增长, 而是按照线性方式增长

3.8 延迟应答

如果接收数据的主机立刻返回ACK应答, 这时候返回的窗口可能比较小

a）假设接收端缓冲区为1M. 一次收到了500K的数据; 如果立刻应答, 返回的窗口就是500K

但实际上可能处理端处理的速度很快, 10ms之内就把500K数据从缓冲区消费掉了

b）在这种情况下, 接收端处理还远没有达到自己的极限, 即使窗口再放大一些, 也能处理过来

如果接收端稍微等一会再应答, 比如等待200ms再应答, 那么这个时候返回的窗口大小就是 1M