计算机网络正朝着高速化,计算机网络第五章运输层

5.1运输层协议概述

5.1.1进程之间的通信

从通信和信息处理的角度看,运输层向它上面的应用层提供通信服务,它属于面向通信部分的最高层,同时也是用户功能的最低层

当网络的边缘部分中的两个主机使用网络的核心部分的功能进行端到段的通信时,只有位于网络边缘部分的主机的协议栈才有运输层,而网络核心部分中的路由器在转发分组时都只用到下三层的功能

运输层为相互通信的应用提供了逻辑通信

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

应用进程之间的通信

两个主机进行通信实际上就是两个主机中的应用进程互相通信

应用进程之间的通信又称为端到端的通信

运输层的一个很重要的功能就是复用和分用。应用层不同进程的报文通过不同的端口向下交到运输层,再往下就共用网络层提供的服务

“运输层提供应用进程间的逻辑通信”。“逻辑通信”的意思是:运输层之间的通信好像是沿水平方向传送数据。但事实上这两个运输层之间并没有一条水平方向的物理连接

运输层协议和网络层协议的主要区别

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

运输层的主要功能

运输层为应用进程之间提供了端到端的逻辑通信(但网络层是为主机之间提供逻辑通信)

运输层还要对收到的报文进行差错检测

运输层需要两种不同的运输协议,即面向连接的TCP和无连接的UDP

两种不同的运输协议

运输层向高层用户屏蔽了下面网络核心的细节(如网络拓扑、所采用的路由选择协议等),它使应用进程看见的就是好像在两个运输层实体之间有一条端到端的逻辑通信信道

当运输层采用面向连接的TCP协议时,尽管下面的网络是不可靠的(只提供尽最大努力服务),但这种逻辑通信信道就相当于一条全双工的可靠信道

当运输层采用无连接的UDP协议时,这种逻辑通信信道是一条不可靠信道

5.1.2运输层的两个主要协议

TCP/IP的运输层有两个不同的协议:

(1)用户数据报协议UDP(User Datagram Protocol)

(2)传输控制协议TCP(Transmission Control Protocol)

TCP与UDP

两个对等运输实体在通信时传送的数据单位叫作运输协议数据单元TPDU(Transport Protocol Data Unit)

TCP传送的数据单位协议是TCP报文段(segment)

UDP传送的数据单位协议是UDP报文或用户数据报

TCP/IP体系中的运输层协议

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

TCP与UDP

UDP在传送数据之前不需要先建立连接。对方的传输层在收到UDO报文后,不需要给出任何确认,虽然UDP不提供可靠交付,但在某些情况下UDO是一种最有效的工作方式

TCP则提供面向连接的服务。TCP不提供广播或多播服务。由于TCP要提供可靠地、面向连接的运输服务,因此不可避免地增加了许多的开销。这不仅使协议数据单元的首部增大很多,还要占用许多的处理机资源

强调两点

运输层的UDP用户数据报与网际层的IP数据报有很大区别。IP数据报要经过互连网中许多路由器的存储转发,但UDP用户数据报是在运输层的端到端抽象的逻辑信道中传送的

TCP报文段是在运输层抽象的端到端逻辑信道中传送,这种信道是可靠地全双工信道。但这样的信道却不知道究竟经过了哪些路由器,而这些路由器也根本不知道上面的运输层是否建立了TCP连接

5.1.3运输层的端口

运行在计算机中的进程是用进程标识符来标志的

运行在应用层的各种应用进程却不应当让计算机操作系统指派它的进程标识符。这是因为在因特网上使用的计算机的操作系统种类很多,而不同的操作系统又使用不同格式的进程标识符

为了使运行不同操作系统的计算机的应用进程能够互相通信,就必须用统一的方法对TCP/IP体系的应用进程进行标志

需要解决的问题

由于进程的创建和撤销都是动态地,发送方几乎无法识别其他机器上的进程

有时我们会改换接收报文的进程,但并不需要通知所有发送方

我们往往需要利用目的主机提供的功能来识别终点,而不需要知道实现这个功能的进程

端口号(protocol port number)

解决这个问题的方法及时在运输层使用协议端口号,或通常简称为端口

虽然通信的终点时应用进程,但我们可以把端口想象是通信的终点,因为我们只要把要传送的报文交到目的主机的某一个合适的目的端口,剩下的工作(即最后交付的目的进程)就由TCP来完成

软件端口和硬件端口

在协议栈层间的抽象协议端口是软件端口

路由器或交换机上的端口是硬件端口

硬件端口是不同硬件设备进行交互的接口,而软件端口是应用层的各种协议进程与运输实体进行层间交互的一种地址

TCP端口

端口用一个16位端口号进行标志

端口号只具有本地意义,即端口号只是为了标志本计算机应用层中的各进程,在因特网中不同计算机的相同端口号是没有联系的

三类端口

熟知端口,是指一般为0 ~ 1023

登记端口号,数值为1024 ~ 49151,为没有熟知端口号的应用程序使用的。使用这个范围的端口必须在IANA登记,以防止重复

客户端口号或短暂端口号,数值为49152 ~ 65535,留给客户进程选择暂时使用。当服务器进程收到客户进程的报文时,就知道了客户进程所使用的动态端口号。通信结束后,这个端口号可供其他客户进程以后使用

5.2用户数据报协议UDP

5.2.1UDP概述

UDP只在IP的数据报服务至上增加了很少一点的功能,即端口的功能和差错检测的功能

虽然UDP用户数据报只能提供不可靠的交付,但UDP在某些方面有其特殊的优点

UDP的主要特点

UDP是无连接的,即发送数据之前需要建立连接

UDP使用尽最大努力交付,即不保证可靠交付,同时也不使用拥塞控制

UDP是面向报文的。UDP没有拥塞控制,很适合多媒体通信的要求

UDP支持一对一、一对多、多对一和多对多的交互通信

UDP的首部开销小,只有8个字节

面向报文的UDP

发送方UDP对应用程序交下来的报文,在添加首部后就向下交付IP层。UDP对应用层交下来的报文,既不合并,也不拆分,而是保留这些报文的边界

应用交给UDP多长的报文,UDP就照样发送,即一次发送一个报文

接收方UDP对IP层交上来的UDP用户数据报,在去除首部后就原封不动地交付上层的应用进程,一次交付一个完整的报文

应用程序必须选择合适大小的报文

UDP是面向报文的

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

5.2.2UDP的首部格式

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

UDP基于端口的分用

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

用户数据报UDP有两个字段:数据字段和首部字段。首部字段有8个字节,由4个子弹组成,每个字段都是两个字节。

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

在计算校验和时,临时把“伪首部”和UDP用户数据报连接在一起。伪首部仅仅是为了计算校验和

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

5.3传输控制协议TCP概述

5.3.1 TCP最主要的特点

TCP是面向连接的运输层协议

每一条TCP连接只能有两个端点(endpoint,每一条TCP连接只能是点对点的(一对一))。

TCP提供可靠交付的服务

TCP提供全双工通信

面向字节流

TCP面向流的概念

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

应当注意

TCP连接时一条虚连接而不是一条真正的物理连接

TCP对应用进程一次把多长的报文发送到TCP的缓存中是不关心的

TCP根据对方给出的窗口值和当前网络拥塞的程度来决定一个报文段应包含多少个字节(UDP发送的报文长度是应用进程给出的)

TCP可把太长的数据块划分短一些再传送。TCP也可等待积累有足够多的字节后再构成报文段发送出去

5.3.2 TCP的连接

TCP把连接作为最基本的抽象

每一条TCP连接有两个端点

TCP连接的端点不是主机,不是主机的IP地址,不是应用进程,也不是运输层的协议端口。TCP连接的端点叫做套接字(Socket)或插口

端口号拼接到(concatenated with)IP地址即构成了套接字

套接字(Socket)

套接字 socket = (IP地址:端口号)

每一条TCP连接唯一地被通信两端的两个端点(即两个套接字)所确定。即:

TCP连接 :: = {socket1,socket2} = {(IP1:port1),(IP2:port2)}

同一个名词socket有多重不同的意思

应用编程接口API称为socket API,简称为socket

socket API中使用的一个函数名也叫做socket。

调用socket函数的端点称为socket

调用socket函数时其返回值称为socket描述符,可简称为socket

在操作系统内核中联网协议Berkeley实现,称为socket实现

5.4可靠传输的工作原理

5.4.1停止等待协议

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

注意

在发送完一个分组后,必须暂时保留已发送的分组的副本

分组和确认分组都必须进行编号

超时计时器的重传时间应当比数据在分组传输的平均往返时间更长一些

确认丢失和确认迟到

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

可靠通信的实现

使用上述的确认和重传机制,我们就可以在不可靠的传输网络上实现可靠地通信

这种可靠传输协议常称为自动重传请求ARQ(Automatic Repeat reQuest)

ARQ表明重传的请求是自动进行的。接收方不需要请求发送方重传某个出错的分组

信道利用率

停止等待协议的有点是简单,但缺点是信道利用率太低

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

math?formula=U(%E4%BF%A1%E9%81%93%E5%88%A9%E7%94%A8%E7%8E%87)%20%3D%20%5Cfrac%7BT_D%7D%7BT_D%20%2B%20RTT%20%2B%20T_A%7D

流水线传输

发送方可连续发送多个分组,不必每发完一个分组就停顿下来等待对方的确认

由于信道上一直有数据不间断地传送,这种传输方式可获得很高的信道利用率

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

5.4.2连续ARQ协议

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

累积确认

接收方一般采用累积确认的方式。即不必对收到的分组逐个发送确认,而是对按序到达的最后一个分组发送确认,这样就表示:到这个分组为止的所有分组都已正确收到了

累积确认有的优点是:容易实现,即使确认丢失也不必重传。缺点是:不能向发送方反映出接收方已经确认收到的所有分组的信息

Go-back-N(回退N)

如果发送方发送了前5个分组,而中间的第3个分组丢失了。这时接收方只能对前两个分组发出确认。发送方无法知道后面三个分组的下落,而只好把后面的三个分组都再重传一次

这就叫做Go-back-N(回退N),表示需要再退回来重传已发送过的N个分组

可见当通信线路质量不好时,连续ARQ协议会带来负面影响

TCP可靠通信的具体实现

TCP连接的每一端都必须设有两个窗口——一个发送窗口和一个接收窗口

TCP的可靠传输机制用字节的序号进行控制。TCP所有的确认都是基于序号而不是基于报文段

TCp两端的四个窗口经常处于动态变化之中

TCP连接的往返时间RTT也不是固定不变的。需要使用特定的算法估算较为合理的重传时间

5.5 TCP报文的首部格式

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

源端口和目的端口字段——各占2字节。端口是运输层与应用层的服务接口。运输层的复用和分用功能都要通过端口才能实现

序号字段——占4字节。TCP连接中发送的数据流猴子那个的每一个字节都编上一个序号。序号字段的值则指的是本报文段所发送的数据的第一个字节的序号

确认好字段——占4个字节,是期望收到对方的下一个报文段的数据的第一个字节的序号

数据偏移(即首部长度)——占4位,它指出TCP报文段的数据起始处距离TCP报文段的起始处有多远。“数据偏移”的单位是32位字(以4字节为计算单位)

保留字段——占6位,保留为今后使用,但目前应置为0

紧急URG——当URG=1时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据)

确认ACK——只有当ACK=1时确认号字段才有效。当ACK=0时,确认号无效

推送PSH(PUSH)——接受TCP收到PSH=1的报文段,就尽快地交付接收应用进程,而不再等到整个缓存都填满了后再向上交付

复位RST(ReSeT)- 当RST=1时,表明TCP连接中出现严重差错(如由主机奔溃或其他原因),必须释放连接,然后重新建立运输连接

同步SYN——同步SYN=1表示这是一个连接请求或连接接受报文

终止FIN(FINis)——用来释放一个连接。FIN=1表明此报文段的发送端的数据已发送完毕,并要求释放运输连接

窗口字段——占2字节,用来让对方设置发送窗口的依据,单位为字节

校验和——占2字节。校验和字段校验的范围包括首部和数据这两部分。在计算校验和时,要在TCP报文段的前面加上12字节的伪首部

紧急指针字段——占16位,指出在本报文段中紧急数据共有多少个字节(紧急数据放在本报文段数据的最前面)

选项字段——长度可变。TCP最初之规定了一种选项,即最大报文段长度MSS。MSS告诉对方TCP:“我的缓存所能接受的报文段的数据字段的最大长度是MSS个字节”。

MSS(Maximum Segment Size)是TCP报文段中的数据字段的最大长度。数据字段加上TCP首部才等于整个TCP报文段。

填充——这是为了使整个首部长度是4字节的整数倍

其它选项

窗口扩大选项——占3字节,其中有一个字节表示移位值S。新的串口值等于TCP首部中的窗口位数增大到(16+S),相当于把窗口值向左移动S位后获得实际的窗口大小

时间戳选项——占10个字节,其中最主要的字段时间戳字段(4字节)和时间戳回送回答字段

选项确认选项

5.6 TCP可靠传输的实现

5.6.1 以字节位单位的滑动窗口

根据B给出的窗口值A构造出自己的发送窗口

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

A发送了11个字节

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

math?formula=P_3 -

math?formula=P_1 = A的发送窗口(又称为通知窗口)

math?formula=P_2 -

math?formula=P_1 = 已发送但尚未收到确认的字节数

math?formula=P_3 -

math?formula=P_2 = 允许发送但尚未发送的字节数(又称为可用窗口)

A收到新的确认号,发送窗口向前滑动

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

A的发送窗口内的序号都已用完,但还没有再收到确认,必须停止发送

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

发送缓存

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

接收缓存

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

发送缓存和接收缓存的作用

发送缓存用来暂时存放存放:

发送应用程序传送给发送方TCP准备发送的数据;

TCP已发送出但尚未收到确认的数据

接收缓存用来暂时存放:

按序到达的、但尚未被接收应用程序读取的数据;

不按序到达的数据

需要强调三点

A的发送窗口并不总是和B的接收窗口一样大(因为有一定的时间滞后)

TCP标准没有规定对不按序到达的数据应如何处理。通常是先临时存放在接收窗口中,等到字节流中所缺少的字节接收后,再按序交付上层的应用进程

TCP要求接收方必须累积确认的功能,这样可以减少传输开销

5.6.2超时重传时间的选择

重传机制是TCP中最重要和最复杂的问题之一

TCP每发送一个报文段,就对这个报文设置一次计时器。只要计时器设置的重传时间到但没有收到确认,就要重传这一段报文

往返时延的方差很大

由于TCP的下层是一个互联网,IP数据报所选择的路由变化很大。因而运输层的往返时间的方差也很大

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

加权平均往返时间

TCP保留了RTT的一个加权平均往返时间

math?formula=RTT_S(这又称为平滑的往返时间)

第一次测量到RTT样本,

math?formula=RTT_S值就去取为所测量到的RTT样本值。以后每测量到一个RTT样本,就按下式重新计算一次

math?formula=RTT_S

math?formula=%E6%96%B0RTT_S%20%3D%20%EF%BC%881%20-%20%5Calpha%EF%BC%89%5Ctimes%20(%E6%97%A7%E7%9A%84RTT_S)%20%2B%20%5Calpha%20%5Ctimes%20%EF%BC%88%E6%96%B0%E7%9A%84RTT%E6%A0%B7%E6%9C%AC%EF%BC%89

式中,0 <

math?formula=%5Calpha <1。若

math?formula=%5Calpha 很接近于零,表示RTT值更新较慢。若选择

math?formula=%5Calpha 接近于1,则表示RTT值更新较快

RFC 2988推荐的

math?formula=%5Calpha 值为1/8,即0.125

超时重传时间RTO(Retransmission Time-Out)

RTO应略大于上面得出的甲醛平均往返时间

math?formula=RTT_S

RFO 2988建议使用下式计算RTO:

math?formula=RTO%20%3D%20RTT_S%20%2B%204%20%5Ctimes%20RTT_D

math?formula=RTT_D是RTT的偏差的加权平均值

RFC 2988建议这样计算

math?formula=RTT_D。第一次测量时,

math?formula=RTT_D值取为测量用到的RTT样本值的一半。在以后的测量中,则使用下式计算加权平均的

math?formula=RTT_D

math?formula=%E6%96%B0%E7%9A%84RTT_D%20%3D%20%EF%BC%881%20-%20%5Cbeta%EF%BC%89%5Ctimes%20(%E6%97%A7%E7%9A%84RTT_D

math?formula=)%20%2B%20%5Cbeta%20%5Ctimes%20%7CRTT_S

math?formula=-%20%E6%96%B0%E7%9A%84RTT%E6%A0%B7%E6%9C%AC%7C

math?formula=%5Cbeta%E6%98%AF%E4%B8%AA%E5%B0%8F%E4%BA%8E1%E7%9A%84%E6%B4%97%E6%BC%B1%EF%BC%8C%E5%85%B6%E6%8E%A8%E8%8D%90%E5%80%BC%E6%98%AF1%2F4%EF%BC%8C%E5%8D%B30.25

往返时间的测量相当复杂

TCP报文段1没有收到确认。重传(即报文段2)后,收到了确认报文段ACK

如何判定此确认报文段是对原来的报文段1的确认,还是对重传的报文段2的确认?

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

Karn算法

在计算平均往返时间RTT时,只要报文段重传了,就不采用其往返时间样本。

这样得出的加权平均往返时间

math?formula=RTT_S和超时重传时间RTO就较为准确

修正的Karn算法

报文段每重传一次,就把RTO增大一些:

math?formula=%E6%96%B0%E7%9A%84RTO%20%3D%20%5Cgamma%20%5Ctimes (旧的RTO)

系数

math?formula=%5Cgamma的典型值是2

当不再发生报文段的重传时,才根据报文段往返时延更新平均往返时延RTT和超时重传时间RTO的数值

实践证明,这种策略较为合理

5.6.3选择确认SACK(Selective ACK)

接收方收到了和前面的字节流不连续的两个字节块

如果这些字节的序号都在接收窗口之内,那么接收方就先收下这些数据,但要把这些信息准确地告诉发送方,使发送方不要再重复发送这些已收到的数据

接收的字节流序号不连续

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

和前后字节不连续的每一个字节块都有两个边界:左边界和右边界。图中用四个指针标记这些边界。

第一个字节块的左边

math?formula=L_1 = 1501,但右边界

math?formula=R_1 = 3001

左边界指出的字节块的第一个字节的序号,但右边界减1才是字节块中的最后一个序号

第二个字节块的左边界

math?formula=L_2 = 3501,而右边界

math?formula=R_2 = 4501

RFC 2018的规定

如果要使用选择确认,那么在建立TCP连接时,就要在TCP首部的选项中加上“允许SACK”的选项,而双方必须都事先商定好

如果使用选择确认,那么原来首部中的“确认号字段”的用法仍然不变。只是以后在TCP报文段的首部中都增加了SACK选项,以便报告收到的不连续的字节块的边界

由于首部选项的长度最多只有40字节,而知名一个边界就要用掉4字节,因此在选项中最多只能指明4个字节块的边界信息

5.7 TCP流量控制

5.7.1 利用滑动窗口实现流量控制

一般来说,我们总是希望数据传输得更快些。但如果发送方把数据发送得过快,接收方就可能来不及接收,这就会造成数据的丢失

流量控制(flow control)就是让发送方的发送速率不要太快,既要让接收方来得及接收,也不要使网络发生阻塞

利用滑动窗口机制可以很方便地在TCP连接上实现流量控制

流量控制举例

A向B发送数据。在建立时,B告诉A:“我的接收窗口rwnd = 400(字节)”

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

持续计时器(persistence timer)

TCP为每一个连接设有一个持续计时器

只要TCP连接的乙方收到对方的零窗口通知,就启动持续计时器

若持续计时器设置的时间到期,就发送一个零窗口探测报文段(仅携带1字节的数据),而对方就在确认这个探测报文段时给出了现在的窗口值

若窗口仍然为零,则收到这个报文段的一方就重新设置持续计时器

若窗口不是零,则死锁的僵局就可以打破了

5.7.2 必须考虑传输效率

可以用不同的机制来控制TCP报文段的发送时机:

第一种机制是TCP维持一个变量,它等于最大报文段长度MSS时。只要缓存中存放的数据达到MSS字节时,就组成一个TCP报文段发送出去

第二种机制是由发送方的应用进程指明要求发送报文段,即TCP支持的推送(push)操作

第三种机制是发送方的一个计时器期限到了,这时就把当前已有的缓存数据装入报文段(但长度不能超过MSS)发送出去

5.8 TCP的拥塞控制

5.8.1 拥塞控制的一般原理

在某段时间,若对网络中某资源的需求超过了该资源所能提供的可用部分,网络的性能就要变坏——产生拥塞(congestion)

出现资源拥塞的条件:

math?formula=%E5%AF%B9%E8%B5%84%E6%BA%90%E7%9A%84%E9%9C%80%E8%A6%81%E7%9A%84%E6%80%BB%E5%92%8C%20%3E%20%E5%8F%AF%E7%94%A8%E8%B5%84%E6%BA%90

若网络中有许多资源同时产生拥塞,网络的性能就要明显变坏,整个网络的吞吐量将随输入负荷的增大而下降

拥塞控制与流量控制

拥塞控制所要做的都有一个前提,就是网络能够承受现有的网络负荷

拥塞控制是一个全局性的过程,涉及到所有的主机、所有的路由器,以及与降低网络传输性能有关的所有因素

流量控制往往指在给定的发送端和接收端之间的点对点通信量的控制

流量控制所要做的就是抑制发送端发送数据的速率,以便使接收端来得及接收

拥塞控制所起的作用

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

拥塞控制的一般原理

拥塞控制是很难设计的,因为它是一个动态地(而不是静态的)问题

当前网络正朝着高速化的方向发展,这很容易出现缓存不够大而造成分组的丢弃。但分组的丢失是网络发生拥塞的征兆而不是原因

在许多情况下,甚至正是拥塞控制本身称为引起网络性能恶化甚至发生死锁的原因。这点应特别引起重视

开环控制和闭环控制

开环控制方法就是在设计网络时事先将有关发生阻塞的因素考虑周到,力求网络在工作时不产生拥塞

闭环控制是基于反馈环路的概念。属于闭环控制的有以下几种措施:

检测网络系统以便检测到拥塞在何时、何处发生

将调整发生的信息传送到可采取行动的地方

调整网络系统的运行以解决出现的问题

5.8.2 几种拥塞控制方法

1.慢开始和拥塞避免

发送方维持一个叫做拥塞窗口cwnd(congestion window)的状态变量。拥塞窗口的大小取决于网络的拥塞程度,并且动态地在变化。发送方让字节的发送窗口等于拥塞窗口。如再考虑到接收方的接收能力,则发送窗口还可能小于拥塞窗口

发送方控制拥塞窗口的原则是:只要网络没有出现拥塞,拥塞窗口就再增大一些,以便把更多的分组发送出去。但只要网络出现拥塞,拥塞窗口就减小一些,以减小注入网络中的分组数

慢开始算法的原理

在主机刚刚开始发送报文段时可先设置拥塞窗口cwnd = 1,即设置为一个最大报文段MSS的数值

在每收到一个队新的报文的确认后,将拥塞窗口加1,即增加一个MSS的数值

用这样的方法逐步增大阿松段的拥塞窗口cwnd,可以使分组注入网络的速率更加合理

发送方每收到一个对新报文段的确认(重传的不算在内)就使cwnd加1

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

传输轮次(transmission round)

使用慢开始算法后,每经过一个传输次轮,拥塞窗口cwnd就加倍

一个传输轮次所经历的时间其实就是往返时间RTT

“传输轮次”更加强调:把拥塞窗口cwnd所允许发送的报文段都连续发送出去,并受到了对已发送的最后一个字节的确认

例如,拥塞窗口cwnd = 4,这时的往返时间RTT就是发送方连续发送4个报文段,并受到这4个报文段的确认,总共经历的时间

设置慢开始门限状态变量ssthresh

慢开始门限ssthresh的用法如下:

当cwnd < ssthresh时,使用慢开始算法

当cwnd > ssthresh时,停止使用慢开始算法而改用拥塞避免算法

当cwnd = ssthresh时,即可使用慢开始算法,也可使用拥塞避免算法

拥塞避免算法的思路是让拥塞窗口cwnd缓慢地增大,即没经过一个往返时间RTT就把发送方的拥塞窗口cwnd加1,而不是加倍,使拥塞窗口cwnd按线性规律增长

当网络出现拥塞时

无论在慢开始阶段还是在拥塞阶段,只要发送方判断网络出现拥塞(其根据就是没有按时收到确认),就要把慢开始门限ssthresh设置发出现拥塞时的发送方窗口值的一半(但不能小于2)

然后把拥塞窗口cwnd重新设置为1,执行慢开始算法

这样做的目的就是要迅速减少主机发送到网络中的分组数,使得发生拥塞的路由器有足够时间把队列中积压的分组处理完毕

慢开始和拥塞避免算法实现举例

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

当TCP连接进行初始化时,将拥塞窗口置为1.图中的窗口单位不使用字节而使用报文段

慢开始门限的初始值设置为16个报文段,即ssthresh = 16

发送端的发送窗口不能超过拥塞窗口cwnd和接收窗口rwnd中的最小值。我们假定接收端窗口足够大,因而现在发送窗口的数值等于拥塞窗口的数值

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

在执行慢开始算法时,拥塞窗口cwnd的初始值为1,发送第一个报文段

math?formula=M_0

发送端每收到一个确认,就把cwnd加1.于是发送端可以接着发送

math?formula=M_1

math?formula=M_2两个报文段

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

接收端共发回两个确认。发送端每收到一个对报文段的确认,就把发送端的cwnd加1.现在cwnd从2增大到4,并可接着发送后面的4个报文段

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

发送端每收到一个对新报文段的确认,就把发送端的拥塞窗口加1,因此拥塞窗口cwnd随着传输轮次按指数规律增长

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

当拥塞敞口cwnd增长到慢开始门限值ssthresh时(即当cwnd = 16时),就改为执行拥塞避免算法,拥塞窗口按线性规律增长

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

假定拥塞窗口的数值增长到24时,网络出现超时,表明网络拥塞了。

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

更新后的ssthresh值变为12(即发送窗口数值24的一半),拥塞窗口再重新设置为1,并执行慢开始算法

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

当cwnd = 12时改为执行拥塞避免算法,拥塞窗口按线性规律增长,每经过一个往返时延就增加了一个MSS的大小

乘法减小

“乘法减小”是指不论在慢慢开始阶段还是拥塞避免阶段,只要出现一次超时(即出现一次网络拥塞),就把慢开始门限值ssthresh设置为挡圈的拥塞窗口乘以0.5

当网络频繁出现阻塞时,ssthresh值就下降得很快,以大大减少注入网络中的分组数

加法增大

“加法增大”是执行拥塞避免算法后,在收到对所有报文段的确认后(即经过一个往返时间),就把拥塞窗口cwnd增加一个MSS大小,使拥塞窗口缓慢增大,以防止网络过早出现拥塞

必须强调指出

“拥塞避免”并非完全能够避免了拥塞。利用以上的措施要完全避免网络拥塞还是不可能的

“拥塞避免”是说在拥塞避免阶段把拥塞窗口控制为按线性规律增长,使网络比较不容易出现拥塞

2.快重传和快恢复

快重传算法首先要求接收方每收到一个失序的报文段就立即发出重复确认。这样做可以让发送方及早知道有报文段没有到达接收方

发送方只要一连收到三个重复就勇当立即重传对方尚未收到的报文段

不难看出,快重传并非取消重传计时器,而是在某些情况下可更早地重传丢失的报文段

快重传举例

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

快恢复算法

(1)当发送端收到连续三个重复的确认时,就执行“乘法减小”算法,把慢开始门限ssthresh减半。但接下去不执行慢开始算法

(2)由于发送方现在认为网络很可能没有发生拥塞,因此现在不执行慢开始算法,即拥塞窗口cwnd现在不设置为1,而是设置为慢开始门限ssthresh减半后的数值,然后开始执行拥塞避免算法(“加法增大”),使拥塞窗口缓慢地线性增大

从连续收到三个重复的确认转入拥塞避免

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

发送窗口的上限值

发送方的发送窗口的上限值应当取为接收方窗口rwnd和拥塞窗口cwnd这两个变量中较小的一个,即应按以下公式确定:

math?formula=%E5%8F%91%E9%80%81%E7%AA%97%E5%8F%A3%E7%9A%84%E4%B8%8A%E9%99%90%E5%80%BC%20%3D%20Min%20%5Brwnd%EF%BC%8Ccwnd%5D

当rwnd < cwnd时,是接收方的接收能力限制发送窗口的最大值

当cwnd < rwnd时,则是网络的拥塞限制发送窗口的最大值

5.8.3 随机早期检测RED(Random Early Detection)

使路由器的队列维持两个参数,即队列长度最小门限

math?formula=TH_min和最大门限

math?formula=TH_max

RED对每一个到达的数据报都先计算平均队列长度

math?formula=L_%7BAV%7D

若平均队列长度小于最小门限

math?formula=TH_min,则将新到达的数据报放入队列进行排队

若平均队列长度超过最大门限

math?formula=TH_max,则将新到达的数据报丢弃

若平均队列长度超过最大门限

math?formula=TH_max,则将新到达的数据报丢弃

若平均队列长度在最小门限

math?formula=TH_min和最大门限

math?formula=TH_max之间,则按照某一概率p将新到达的数据报丢弃

RED将路由器的到达队列划分称为三个区域

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

丢弃概率p与

math?formula=TH_min

math?formula=TH_max的关系

math?formula=L_AV <

math?formula=TH_min时,丢弃概率p = 0

math?formula=L_AV >

math?formula=TH_max时,丢失概率p = 1

math?formula=TH_min <

math?formula=L_AV <

math?formula=TH_max时,0 < p < 1

例如,按线性规律变化,从0变到

math?formula=p_max

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

瞬时队列长度和平均队列长度的区别

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

5.9 TCP的运输连接管理

1.运输连接的三个阶段

运输连接就有三个阶段,即:连接建立、数据传送和连接释放。运输连接的管理就是使运输连接的建立和释放都能正常地进行

连接建立过程中要解决一下三个问题:

要使每一方能够确制对方的存在

要允许双方协商一些参数(如最大报文段长度,最大窗口大小,服务质量等)

能够对运输实体资源(如缓存大小,连接表中的项目)进行分配

客户服务器方式

TCP连接的建立都是采用客户服务器方式

主动连接建立的应用进程叫做客户

被动等待连接建立的应用进程叫做服务器

5.9.1 TCP的连接建立

用三次握手建立TCP

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

A的TCP向B发出连接请求报文段,其首部中的同步位SYN = 1,并选择序号 seq = x,表明传送数据时的第一个数据字节的序号是x

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

B的TCP收到连接请求报文段后,如同意,则发回确认。

B在确认报文段中应使SYN = 1,使ACK = 1,其确认号ack = x + 1,自己选择的序号seq = y

A收到此报文段后向B给出确认,其ACK = 1,确认号ack =y + 1.

A的TCP通知上层应用进程,进程已经建立

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

B的TCP收到主机A的确认,也通知其上层 应用进程:TCP连接已经建立。

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

5.9.2 TCP的连接释放

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

数据传输结束后,通信的双方都可释放连接。现在A的应用进程先向其TCP发出连接释放报文段,并停止再发送数据,主动关闭TCP连接

A把连接释放报文段首部的FIN = 1,其序号seq = u,等待B的确认

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

B发出确认,确认号ack = u + 1,而这个报文段自己的序号seq = v。

TCP服务器进程通知高层应用进程。

从A到B这个方向的连接就释放了,TCP连接处于半封闭状态。B若发送数据,A仍要接收

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

若B已经没有要向A发送的数据,其应用进程就通知TCP释放连接

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

A收到连接释放报文段后,必须发出确认

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

在确认确认报文段中ACK = 1,确认号ack = w + 1,自己的序号seq = u + 1

TCP连接必须经过时间2MSL后才释放掉

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

A必须等待2MSL的时间

第一,为了保证A发送的最后一个ACK报文段能够到达B

第二,防止“已失效的连接请求报文段”出现在本连接中。A在发送完最后一个ACK报文段后,再经过时间2MSL,就可以使本连接持续的时间内所产生的所有报文段,都从网络中消失。这样就可以使下一个新的连接中不会出现这样旧的连接请求报文段

5.9.3 TCP的有限状态机

TCP有限状态机的图中每一个方框都是TCP可能具有的状态

每个方框中的大写英文字符串是TCP标准所使用的TCP连接状态名。状态之间的箭头表示可能发生的状态变迁

箭头旁边的字,表明引起这种变迁的原因,或表示发生状态变迁后又出现什么动作

图中有三种不同的箭头

粗实线箭头表示对客户进程的正常变迁

粗虚线箭头表示对对服务器进程的正常变迁

另一种细线箭头表示异常变迁

TCP的有限状态机

9c13d06479a7?utm_campaign=maleskine&amp%3Butm_content=note&amp%3Butm_medium=seo_notes&amp%3Butm_source=recommendation

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值