目录
数据链路层属于计算机网络的低层。数据链路层使用的信道主要有以下两种类型:
- 点对点信道。这种信道使用一对一的点对点通信方式。
- 广播信道。这种信道使用一对多的广播通信方式,因此过程比较复杂。广播信道上连接的主机很多,因此必须使用专用的共享信道协议来协调这些主机的数据发送。
局域网虽然是个网络,但我们并不把局域网放在网络层中讨论。这是因为网络层要讨论的问题是多个网络互连的问题,是讨论分组怎样从一个网络通过路由器转发到另一个网络。在本章中我们研究的是同一个局域网中,分组怎样从一台主机传送到另一台主机,但不经过路由器转发。从整个互联网来看,局域网仍属于数据链路层的范围。
本章最重要的内容:
- 数据链路层的点对点信道和广播信道的特点,以及这两种信道所使用的协议(PPP协议以及CSMA/CD协议)的特点。
- 数据链路层的三个基本问题:封装成帧、透明传输、差错检测。
- 以太网MAC层的硬件地址。
- 适配器、转发器、集线器、网桥、以太网交换机的作用以及使用场合。
下图是两台主机通过互联网进行通信时数据链路层所处的地位。
(a)表示用户主机H1通过电话线上网,中间经过R1,R2,R3三个路由器连接到远程主机H2。所经过的网络可以是多种的,如电话网、局域网和广域网。当主机H1向H2发送数据时,从协议的层次上看,数据的流动如图(b)所示。主机H1和主机H2都有完整的五层协议栈,但路由器在转发分组时使用的协议栈只有下面的三层。(注:当路由器之间在交换路由信息时,根据所使用的路由选择协议不同,也有可能需要用到运输层协议。见第四章的第5点。)数据进入路由器后,先从物理层上到网络层,在网络层的转发表中找到下一跳的地址后,再下到物理层转发出去。因此,数据从H1到H2需要在路径中的各结点的协议栈向上和向下流动多次,如上图中箭头所示。
当我们专门研究数据链路层时,许多情况下我们只关心在协议栈中水平方向的各数据链路层,于是当H1向H2发送数据时,我们可以想象数据就是在数据链路层从左向右沿水平方向传送的,即如下图所示:
H1→R1→R2→R3→H2。这中间四段不同的链路层可能采用不同的数据链路层协议。
1. 使用点对点信道的数据链路层
本节讨论使用点对点信道的数据链路层的一些基本问题,其中一些概念对广播信道也适用。
1.1 数据链路和帧
首先要明确,“链路”和“数据链路”不是一回事儿:
- 链路(link)是一个结点到相邻节点的一段物理线路(有线或无线),而中间没有任何其他交换结点。在进行数据通信时,两台计算机之间的通信路径往往要经过许多段这样的链路。链路只是一条路径的组成部分。
- 数据链路(data link)是另一个概念。这是因为当需要在一条线路上传送数据时,除了必须有一条物理线路外,还必须有一些必须的通信协议来控制这些数据的传输。若把实现这些协议的硬件和软件加到链路上,就构成了数据链路。现在最常用的方法是使用网络适配器(既有硬件,也有软件)来实现这些协议。一般的适配器都包括了数据链路层和物理层这两层的功能。
也有另外的术语:把链路分为物理链路和逻辑链路。物理链路就是“链路”,逻辑链路就是“数据链路”,是物理链路加上必要的通信协议。
早期的数据通信协议曾叫做通信规程(procedure)。因此在数据链路层,规程和协议是同义语。
下面介绍点对点信道的数据链路层的协议数据单元——帧。
数据链路层把网络层交下来的数据构成帧发送到链路上,以及把接收到的帧中的数据取出并上交给网络层。在互联网中,网络层协议数据单元就是IP数据报(或简称为数据报、分组或包)。
为了把主要精力放在点对点信道的数据链路层协议上,可以采用如下图(a)所示的三层模型。在这种三层模型中,不管在哪一段链路上的通信(主机和路由器之间或两个路由器之间),我们都看成是结点和结点之间的通信(如图中A和B结点),而每个结点只有下三层——网络层、数据链路层、物理层。
点对点信道的数据链路层在进行通信时的主要步骤如下:
- 结点A的数据链路层把网络层交下来的数据报添加首部和尾部封装成帧。
- 结点A把封装好的帧发送给结点B的数据链路层。
- 若结点B的数据链路层收到的帧无差错,则从收到的帧中提取出IP数据报交给上面的网络层;否则丢弃这个帧。
1.2 三个基本问题
数据链路层协议有许多种,但有三个基本问题则是共同的。这三个基本问题是:封装成帧、透明传输、差错检测。
1.2.1 封装成帧
封装成帧(framing)就是在一段数据的前后分别添加首部和尾部,这样就构成了一个帧。接收端在收到物理层上交的比特流后,就能根据首部和尾部的标记,从收到的比特流中识别帧的开始和结束。下图表示用帧首部和帧尾部封装成帧的一般概念。分组交换的一个重要概念就是:所有在互联网上传送的数据都以分组(即IP数据报)为传送单位。网络层的IP数据报传送到数据链路层就成为帧的数据部分,在帧的数据部分的前面和后面分别添加上首部和尾部即构成了一个完整的帧。这样的帧就是数据链路层的数据传送单元。一个帧的帧长等于帧的数据部分——帧首部的长度+帧尾部的长度。
帧首部和尾部的一个重要作用就是进行帧定界(确定帧的界限)。此外,首部和尾部还包括许多必要的控制信息。在发送帧时,是从帧首部开始发送的。各种数据链路层协议都对帧首部和帧尾部的格式有明确的规定。显然,为了提高帧的传输效率,应当使帧的数据部分长度尽可能地大于首部和尾部的长度。但是,每一种链路层协议都规定了所能传送的帧的数据部分长度上限——最大传送单元MTU(Maximun Transfer Unit)。上图给了帧的首部和尾部的位置,以及帧的数据部分与MTU的关系。
当数据是由可打印的ASCII码组成的文本文件时,帧定界可以使用特殊的帧定界符。ASCII编码是7为编码,一共可组成128个不同的ASCII码,其中可打印的(可以键入的)有95个,不可打印的有33个。下图说明了帧定界的概念。控制字符SOH(Start Of Header)表示帧的首部开始;控制字符EOH(End Of Header)表示帧的结束。它们的十六进制编码分别是01(二进制00000001)和04(二进制00000100)。
当数据在传输中出现差错时,帧定界符的作用更加明显——假定发送端在尚未发送完一个帧时突然故障,中断了发送。但随后很快又恢复正常,于是重新从头开始发送刚才未发完的帧。由于使用了帧定界符,接收端就知道前面收到的数据是个不完整的帧(只有SOH而没有EOH),必须丢弃。而后面收到的是完整的帧(有明确的帧界定符SOH和EOH),应该收下。
1.2.2 透明传输
由于帧的开始和结束的标记使用专门指明的控制字符,因此所传输的数据中的任何8比特的组合一定不允许和用作帧定界的控制字符的比特编码一样,否则就会出现帧定界的错误。
当传送的帧是用文本文件组成的帧时(文本文件中的字符都是键入的),其数据部分显然不会像SOH和EOH这样的帧定界控制字符。可见不管从键盘上输入什么字符都可以放在这样的帧中传过去,因此这样的传输就是透明传输。
当传送帧的数据部分是非ASCII码的文本文件时(如二进制代码的计算机程序或图像等),又恰好数据中的某个字节的二进制和SOH或EOH这种控制字符一样(如下图),数据链路层就会错误地“找到帧的边界”,把部分帧收下(误认为是一个完整的帧),而把剩下的那部分数据丢弃(这部分找不到帧定界控制字符SOH)。
像上图所示的帧的传输显然不是“透明传输”,因为当遇到数据中碰巧出现字符“EOH”时就传不出去了。数据中的“EOH”将被接收端错误地解释为“传输结束”的控制字符,而在其后面的数据因找不到"SOH"被接收端当作无效帧丢弃。但实际上在数据中出现的字符"EOH"并非控制字符而仅仅是二进制数据00000100。
前面提到的“透明”是一个很重要的术语。它表示:某一个实际存在的事物看起来却好像不存在一样。对传送的数据来说,这些数据看不见数据链路层有什么妨碍数据传输的东西。或者说,数据链路层对这些数据来说是透明的。
为了解决透明传输问题,就必须设法使数据中可能出现的控制字符"SOH"和"EOH"在接收端不被解释为控制字符。具体方法是:发送端的数据链路层在数据中出现控制字符"SOH"或"EOH"的前面插入一个转义字符"ESC"(其十六进制编码是1B,二进制是00011011)。而在接收端的数据链路层在把数据送往网络层之前删除这个插入的转义字符。这种方法称为字节填充(byte stuffing)或字符填充(character stuffing)。如果转义字符也出现在数据当中,那么解决方法仍然是在转义字符前插入一个转义字符。因此。当接收端收到连续的两个转义字符时就删除其中前面的一个。下图表示用字节填充法解决透明传输的问题:
1.2.3 差错检测
现实的通信链路都不会是理想的。这就是说,比特在传输过程中可能会产生差错:1可能变成0,0也可能变成1.这叫做比特差错。比特差错是传输差错中的一种。在一段时间内,传输错误的比特占传输总比特的比率称为误码率BER(Bit Error Rate)。例如,误码率为时,表示平均传送个比特就会出现一个比特的差错。误码率与信噪比有很大的关系。如果设法提高信噪比,就可以使误码率减少。实际的通信链路并非是理想的,他不可能使误码率下降到0。因此,为了保证数据传输的可靠性,在计算机网络传输数据时,必须采用各种差错检测措施。目前在数据链路层广泛使用了循环冗余检验CRC(Cyclic Redundancy Check)的检错技术。
下面通过一个例子来说明循环冗余检验的原理:
在发送端,先把数据划分为组,假定每组k个比特。先假定带传送的数据M=101001(k=6)。CRC运算就是在数据M后面添加供差错检测用的n位冗余码,然后构成一个帧发送出去,一共发送(k+n)位。在所要发送的数据后面增加n位的冗余码,虽然增大了数据传输的开销,但却可以进行差错检测。当传输可能出现差错时,付出这种代价往往是很值得的。
这n位冗余码可以按照以下方法得出。用二进制的模2运算(进行加法时不进位)进行乘M的运算,这相当于在M后面添加n个0。得到的(k+n)位的数除以收发双方事先商定的长度为(n+1)位的除数P,得出商是Q而余数是R(n位,比P少一位)。关于除数P下面还要介绍。在下图所示的例子中,M=101001(k=6),假定除数=1101(n=3)。经模2除法后的结果:商Q=110101(这个商并没有什么用处),而余数R=001。这个余数R就作为冗余码拼接在数据M后面发送出去。这种为了进行检错而添加的冗余码常称为帧检验序列FCS(Frame Check Sequence)。因此加上FCS后发送的帧是101001001(即M+FCS),共有(k+n)位。
BTW,循环冗余检验CRC和帧检验序列FCS并不是一个概念:前者是检错方法,后者是冗余码。在检错方法上可以用CRC,也可以不用。
在接收端把接收到的数据以帧为单位进行CRC检验:把收到的每一帧都除以同样的除数P(模2运算),然后检查得到的余数R。
如果在传输过程中无差错,那么经过CRC检测后得出的R肯定是0;但如果出现误码,那么R仍等于0的概率是非常非常小的。
一种比较简便的方法是用多项式来表示循环冗余检验过程。在上面的例子中,用多项式P(X)=表示上面的除数P=1101。多项式P(X)称为生成多项式。现在广泛使用的生成多项式P(X)有以下几种:
CRC-16=
CRC-CCITT=
CRC-32=+1
在数据链路层中,发送端帧检验序列FCS的生成和接收端的CRC检验都是用硬件完成的,处理很迅速,因此并不会延误数据的传输。
从以上讨论中不难看出,如果我们在传送数据时不以帧为单位来传送,那么就无法加入冗余码以进行差错检验。因此,如果要在数据链路层进行差错检验,就必须把数据划分分帧,每一帧都加上冗余码,一帧接一帧地传送,然后再接收方逐帧进行差错检验。
最后再强调一下,在数据链路层若仅仅使用循环冗余检验CRC差错检测技术,则只能做到对帧的无差错接收,即:“凡是接收端数据链路层接收的帧,我们都能以非常接近于1的概率认为这些帧在传输过程中没有产生差错”。接收端丢弃的帧虽然曾收到了,但最终还是因为有差错被丢弃,即没有被接受。以上所述的可以近似地表述为(通常是这样认为的):“凡是接收端数据链路层接收到的帧均是无差错的”。
请注意,我们现在并没有要i去数据链路层向网络层提供“可靠传输”的服务。所谓“可靠传输”是指:数据链路层的发送端发送什么,接收端就接收什么。传输差错可以分为两大类:一类就是最基本的比特差错,另一类是收到的帧没有出现比特差错,但是存在帧丢失、帧重复、帧失序等问题。所以,在数据链路层使用CRC检验,可以实现无比特差错的传输,但不能保证是可靠传输。
过去OSI的观点是:必须让数据链路层向上提供可靠传输。因此在CRC检错的基础上,增加了帧编号、确认和重传机制。收到正确的帧就要向发送端发送确认。发送端在一定的期限内若没有收到确认,就认为出现了差错并进行重传,直到收到对方的确认为止。现在的互联网有区别对待的方法:
对于通信质量良好的有线传输链路,数据链路层协议不使用确认和重传机制,即不要求数据链路层向上提供可靠传输的服务。如果在数据链路层传输数据时出现了差错并且需要改正,那么改正的任务交由上层协议(例如运输层的TCP协议)来完成;对于通信质量较差的无线传输链路,数据链路层协议使用确认和重传机制,数据链路层向上提供可靠传输的服务(第九章)。实践证明,这样可以提高通信效率。
可靠传输协议在第五章讨论,本章的数据链路层协议都不是可靠传输的协议。
2. 点对点协议PPP
在通信线路质量较差的年代,在数据链路层使用可靠传输协议曾经是一种好办法。因此,能实现可靠传输的高级数据链路控制HDLC(High-level Data Link Control)就成为当时比较流行的数据链路层协议。但现在HDLC已经很少用 。对于点对点的链路,简单得多的点对点协议PPP则是目前使用最广泛的。
2.1 PPP协议的特点
互联网用户通常都要连接到某个ISP才能接入到互联网。PPP协议就是用户计算机和ISP进行通信时所使用的数据链路层协议,如下图。
2.1.1 PPP协议应满足的需求
IETF国际互联网工程任务组(Internet Engineering Task Force)认为,在设计PPP协议时必须考虑以下多方面的需求:
- 简单 IETF在设计互联网体系结构时把其中最复杂的部分放在TCP协议中,而网际协议IP则相对比较简单,它提供的是不可靠的数据报服务。在这种情况下,数据链路层没有必要提供比IP协议更多的功能。因此,对数据链路层的帧,不需要纠错,不需要序号,也不需要流量控制。IETF把“简单”作为首要的需求。简单的设计可以使协议在实现时不容易出错,从而使不同的厂商在协议的不同实现上的互操作性提高了,这也是协议标准化的一个主要目的。 总之,这种数据链路层协议非常简单:接收方每收到一个帧,就进行CRC检验。正确则收下,错误则丢弃。
- 封装成帧 PPP协议必须规定特殊的字符作为帧定界符(即标志一个帧的开始和结束的字符),以便接收端从收到的比特流中能准确地找出帧的开始和结束位置。
- 透明性 PPP协议必须保证数据传输的透明性。这就是说,如果数据中碰巧出现了和帧定界符一样的比特组合时,就要采取有效的措施来解决这个问题,
- 多种网络层协议 PPP协议必须能够在同一条物理链路上同时支持多种网络层协议(如IP和IPX等)的运行。当点对点链路所连接的时局域网或路由器时,PPP协议必须同时支持在链路所连接的局域网或路由器上运行的各种网络层协议。
- 多种类型链路 除了要支持多种网络层的协议外,PPP还必须能够在多种类型的链路上运行。例如,串行的(一次只能发送一个比特)或并行的(一次并行地发送多个比特),同步的或异步的,低速的或高速的,电的或光的,交换的(动态的)或非交换的(静态的)点对点链路。【PPPoE(PPP over Ethernet)在以太网运行的PPP是PPP协议能够适应多种类型链路的一个典型例子。PPPoE是为宽带上网的主机使用的链路层协议。这个协议把PPP帧再封装再以太网帧中(当然还要增加一些能够识别各用户的功能)。宽带上网时由于数据传输速率较高,因此可以让多个连接再以太网上的用户共享一条到ISP的宽带链路。现在,即使是只有一个用户利用ADSL进行宽带上网(也不和其他人共享到ISP的宽带链路),也是使用PPPoE协议,见后面的6.4的讨论。
- 差错检测(error detection) PPP协议必须能够对接收端收到的帧进行检测,并立即丢弃有差错的帧。若在数据链路层不进行差错检测,那么已出现差错的无用帧就还要在网络中继续向前转发,因而会白白浪费许多的网络资源。
- 检测连接状态 PPP协议必须具有一种机制能够及时(不超过几分钟)自动检测出链路是否处于正常工作状态。当出现故障的链路隔了一段时间后又重新恢复正常工作时,就特别需要有这种及时检测功能。
- 最大传送单元 PPP协议必须对每一种类型的点对点链路设置最大传送单元MTU的标准默认值。这样做是为了促进各种实现之间的互操作性。如果高层协议发送的分组过长并超过MTU的数值,PPP就要丢弃这个帧,并返回差错。需要强调的是,MTU是数据链路层的帧可以载荷的数据部分的最大长度,而不是帧的总长度。
- 网络层地址协商 PPP协议必须提供一种机制使通信的两个网络层(如两个IP层)的实体能够通过协商知道或能够配置彼此的网络层地址。协商的算法应尽可能简单,并且能够在任何情况下得出协商结果。这对拨号连接的链路特别重要,因为如果仅仅在链路层建立了连接而不知道对方网络层地址,则还不能够保证网络层可以传送分组。
- 数据压缩协商 PPP协议必须提供一种方法来协商使用数据压缩算法。但PPP协议并不要求将数据压缩算法进行标准化。
在TCP/IP协议族中,可靠传输由运输层的TCP协议负责,因此数据链路层的PPP协议不需要进行纠错,不需要设置序号,也不需要进行流量控制。PPP协议不支持多点线路(即一个主站轮流和链路上的多个从站进行通信),而只支持点对点的链路通信。此外,PPP协议支持全双工链路。
2.1.2 PPP协议的组成
PPP协议的组成有三个部分:
- 一个将IP数据报封装到串行链路的方法。PPP既支持异步链路(无奇偶检验的8比特数据),也支持面向比特的同步链路。IP数据报在PPP帧中就是其信息部分。这个信息部分的长度受最大传送单元MTU的限制。
- 一个用来建立、配置和测试数据链路连接的链路控制协议LCP(Link Control Protocol)。通信的双方可协商一些选项。在RFC1661中定义了11种类型的LCP分组。
- 一套网络控制协议NCP(Network Control Protocol),其中的每一种协议支持不同的网络层协议,如IP、OSI的网络层、DECnet,以及AppleTalk等。
2.2 PPP协议的帧格式
2.2.1 各字段的意义
PPP的帧格式如下图所示。PPP帧的首部和尾部分别为四个字段和两个字段。
- 首部的第一个字段和尾部的第二个字段都是标志字段F(Flag),规定为0x7E。标志字段表示一个帧的开始或结束。因此标志字段就是PPP帧的定界符。连续两帧之间只需要用一个标志字段。如果出现两个连续的标志字段,就表示这是一个空帧,应当丢弃。
- 上图中,首部中的地址字段A规定为0xFF,控制字段C规定为0x03。最初曾考虑以后再对这两个字段的值进行其他定义,但至今也没有给出。可见这两个字段实际上并没有携带P