#TCP/IP# TCP IP详解 卷1:协议-第4章ARP:地址解析协议

4.1 引言

本章我们要讨论的问题是只对T C P / I P协议簇有意义的I P地址。数据链路如以太网或令牌环网都有自己的寻址机制(常常为48 bit地址),这是使用数据链路的任何网络层都必须遵从的。一个网络如以太网可以同时被不同的网络层使用。例如,一组使用T C P / I P协议的主机和另一组使用某种PC网络软件的主机可以共享相同的电缆。

当一台主机把以太网数据帧发送到位于同一局域网上的另一台主机时,是根据48 bit的以太网地址来确定目的接口的。设备驱动程序从不检查I P数据报中的目的I P地址。

地址解析为这两种不同的地址形式提供映射: 32 bit的I P地址和数据链路层使用的任何类型的地址。RFC 826 [Plummer
1 9 8 2 ]是ARP规范描述文档。

本章及下一章我们要讨论的两种协议如图4 - 1所示: A R P(地址解析协议)和RARP(逆地址解析协议)。

A R P为I P地址到对应的硬件地址之间提供动态映射。我们之所以用动态这个词是因为这个过程是自动完成的,一般应用
程序用户或系统管理员不必关心。

R A R P是被那些没有磁盘驱动器的系统使用(一般是无盘工作站或X终端),它需要系统管理员进行手工设置。我们在第5章对它进行讨论。

 


4.2 一个例子

任何时候我们敲入下面这个形式的命令:

% ftp bsdi

都会进行以下这些步骤。这些步骤的序号如图4 - 2所示。

  • 1) 应用程序FTP客户端调用函数g e t h o s t b y n a m e(3)把主机名(bsdi)转换成32 bit的IP地址。这个函数在DNS(域名系统)中称作解析器,我们将在第1 4章对它进行介绍。这个转换过程或者使用DNS,或者在较小网络中使用一个静态的主机文件(/e t c / h o s t s)。
  • 2) F T P客户端请求T C P用得到的I P地址建立连接。
  • 3) T C P发送一个连接请求分段到远端的主机,即用上述I P地址发送一份I P数据报(在第1 8章我们将讨论完成这个过程的细节)。
  • 4) 如果目的主机在本地网络上(如以太网、令牌环网或点对点链接的另一端),那么I P数据报可以直接送到目的主机上。如果目的主机在一个远程网络上,那么就通过I P选路函数来确定位于本地网络上的下一站路由器地址,并让它转发I P数据报。在这两种情况下,I P数据报都是被送到位于本地网络上的一台主机或路由器。
  • 5) 假定是一个以太网,那么发送端主机必须把32 bit的I P地址变换成48 bit的以太网地址。从逻辑I n t e r n e t地址到对应的物理硬件地址需要进行翻译。这就是ARP的功能。ARP本来是用于广播网络的,有许多主机或路由器连在同一个网络上。
  • 6) A R P发送一份称作A R P请求的以太网数据帧给以太网上的每个主机。这个过程称作广播,如图4 - 2中的虚线所示。A R P请求数据帧中包含目的主机的I P地址(主机名为b s d i),其意思是“如果你是这个I P地址的拥有者,请回答你的硬件地址。
  • 7) 目的主机的A R P层收到这份广播报文后,识别出这是发送端在寻问它的I P地址,于是发送一个ARP应答。这个ARP应答包含I P地址及对应的硬件地址。
  • 8) 收到ARP应答后,使ARP进行请求—应答交换的I P数据报现在就可以传送了。
  • 9) 发送I P数据报到目的主机。在A R P背后有一个基本概念,那就是网络接口有一个硬件地址(一个48 bit的值,标识不
  • 同的以太网或令牌环网络接口)。在硬件层次上进行的数据帧交换必须有正确的接口地址。但是,T C P / I P有自己的地址: 32 bit的I P地址。知道主机的I P地址并不能让内核发送一帧数据给主机。内核(如以太网驱动程序)必须知道目的端的硬件地址才能发送数据。A R P的功能是在32 bit的I P地址和采用不同网络技术的硬件地址之间提供动态映射。

点对点链路不使用A R P。当设置这些链路时(一般在引导过程进行),必须告知内核链路每一端的I P地址。像以太网地址这样的硬件地址并不涉及。

 


4.3 ARP高速缓存

A R P高效运行的关键是由于每个主机上都有一个A R P高速缓存。这个高速缓存存放了最近I n t e r n e t地址到硬件地址之间的映射记录。高速缓存中每一项的生存时间一般为2 0分钟,起始时间从被创建时开始算起。

我们可以用a r p(8)命令来检查ARP高速缓存。参数-a的意思是显示高速缓存中所有的内容

bsdi % arp -a
sun (140.252.13.33) at 8:0:20:3:f6:42
svr4 (140.252.13.34) at 0:0:c0:c2:9b:26
C:\Users\arvin.chen>arp -a

Interface: 192.168.4.125 --- 0x5
  Internet Address      Physical Address      Type
  192.168.4.44          50-9a-4c-28-86-39     dynamic
  192.168.4.86          00-0e-c6-bc-1b-b8     dynamic
  192.168.4.128         10-65-30-1c-1b-7f     dynamic
  192.168.4.137         8c-04-ba-2a-87-7c     dynamic
  192.168.5.1           50-da-00-d8-79-ad     dynamic
  192.168.5.10          00-15-5d-5a-10-ce     dynamic
  192.168.5.70          d4-81-d7-ef-b8-25     dynamic
  192.168.5.71          18-66-da-ea-c8-b0     dynamic
  192.168.5.253         00-15-5d-5a-10-d8     dynamic
  192.168.7.255         ff-ff-ff-ff-ff-ff     static
  224.0.0.22            01-00-5e-00-00-16     static
  224.0.0.251           01-00-5e-00-00-fb     static
  231.140.177.39        01-00-5e-0c-b1-27     static
  239.255.255.250       01-00-5e-7f-ff-fa     static
  255.255.255.255       ff-ff-ff-ff-ff-ff     static

48 bit的以太网地址用6个十六进制的数来表示,中间以冒号隔开。在4 . 8小节我们将讨论a r p命令的其他功能。

 


4.4 ARP的分组格式

在以太网上解析I P地址时, A R P请求和应答分组的格式如图4 - 3所示( A R P可以用于其他类型的网络,可以解析I P地址以外的地址。紧跟着帧类型字段的前四个字段指定了最后四个字段的类型和长度)。

以太网报头中的前两个字段是以太网的源地址和目的地址。目的地址为全1的特殊地址是广播地址。电缆上的所有以太网接口都要接收广播的数据帧。

两个字节长的以太网帧类型表示后面数据的类型。对于A R P请求或应答来说,该字段的值为0 x 0 8 0 6。

形容词h a r d w a r e (硬件)和p r o t o c o l (协议)用来描述ARP分组中的各个字段。例如,一个ARP请求分组询问协议地址(这里是I P地址)对应的硬件地址(这里是以太网地址)。

硬件类型字段表示硬件地址的类型。它的值为1即表示以太网地址。协议类型字段表示要映射的协议地址类型。它的值为0 x 0 8 0 0即表示I P地址。它的值与包含I P数据报的以太网数据帧中的类型字段的值相同,这是有意设计的(参见图2 - 1)。

接下来的两个1字节的字段,硬件地址长度和协议地址长度分别指出硬件地址和协议地址的长度,以字节为单位。对于以太网上I P地址的ARP请求或应答来说,它们的值分别为6和4。

操作字段指出四种操作类型,它们是ARP请求(值为1)、ARP应答(值为2)、RARP请求(值为3)和R A R P应答(值为4)(我们在第5章讨论R A R P)。这个字段必需的,因为A R P请求和ARP应答的帧类型字段值是相同的。

接下来的四个字段是发送端的硬件地址(在本例中是以太网地址)、发送端的协议地址(I P地址)、目的端的硬件地址和目的端的协议地址。注意,这里有一些重复信息:在以太网的数据帧报头中和ARP请求数据帧中都有发送端的硬件地址。
对于一个A R P请求来说,除目的端硬件地址外的所有其他的字段都有填充值。当系统收

到一份目的端为本机的A R P请求报文后,它就把硬件地址填进去,然后用两个目的端地址分别替换两个发送端地址,并把操作字段置为2,最后把它发送回去。

 


4.5 ARP举例

在本小节中,我们用t c p d u m p命令来看一看运行像Te l n e t这样的普通T C P工具软件时ARP会做些什么。附录A包含t c p d u m p命令的其他细节。


4.5.1 一般的例子

为了看清楚ARP的运作过程,我们执行t e l n e t命令与无效的服务器连接。

当我们在另一个系统( s u n)上运行带有- e选项的t c p d u m p命令时,显示的是硬件地址(在我们的例子中是48 bit的以太网地址)。

图4 - 4中的t c p d u m p的原始输出如附录A中的图A - 3所示。由于这是本书第一个t c p d u m p输出例子,你应该去查看附录中的原始输出,看看我们作了哪些修改。

我们删除了t c p d u m p命令输出的最后四行,因为它们是结束连接的信息(我们将在第1 8章进行讨论),与这里讨论的内容不相关。

在第1行中,源端主机( b s d i)的硬件地址是0 : 0 : c 0 : 6 f : 2 d : 4 0。目的端主机的硬件地址是ff : ff : ff : ff : ff : ff,这是一个以太网广播地址。电缆上的每个以太网接口都要接收这个数据帧并对它进行处理,如图4 - 2所示。

第1行中紧接着的一个输出字段是a r p,表明帧类型字段的值是0 x 0 8 0 6,说明此数据帧是一个ARP请求或回答。

在每行中,单词a r p或i p后面的值6 0指的是以太网数据帧的长度。由于A R P请求或回答的数据帧长都是4 2字节(2 8字节的ARP数据,1 4字节的以太网帧头),因此,每一帧都必须加入填充字符以达到以太网的最小长度要求: 6 0字节。

请参见图1 - 7,这个最小长度6 0字节包含1 4字节的以太网帧头,但是不包括4个字节的以太网帧尾。有一些书把最小长度定为6 4字节,它包括以太网的帧尾。我们在图1 - 7中把最小长度定为4 6字节,是有意不包括1 4字节的帧首部,因为对应的最大长度( 1 5 0 0字节)指的是M T U—最大传输单元(见图2 - 5)。我们使用M T U经常是因为它对I P数据报的长度进行限制,
但一般与最小长度无关。大多数的设备驱动程序或接口卡自动地用填充字符把以太网数据帧充满到最小长度。第3,4和5行中的I P数据报(包含T C P段)的长度都比最小长度短,因此都必须填充到6 0字节。

第1行中的下一个输出字段arp who-has表示作为A R P请求的这个数据帧中,目的I P地址是s v r 4的地址,发送端的I P地址是b s d i的地址。t c p d u m p打印出主机名对应的默认I P地址(在4 . 7节中,我们将用-n选项来查看ARP请求中真正的I P地址。)

从第2行中可以看到,尽管A R P请求是广播的,但是A R P应答的目的地址却是b s d i(0 : 0 : c 0 : 6 f : 2 d : 4 0)。ARP应答是直接送到请求端主机的,而是广播的。

t c p d u m p打印出arp reply的字样,同时打印出响应者的主机名和硬件地址。

第3行是第一个请求建立连接的T C P段。它的目的硬件地址是目的主机(s v r 4)。我们将在第1 8章讨论这个段的细节内容。

在每一行中,行号后面的数字表示t c p d u m p收到分组的时间(以秒为单位)。除第1行外,其他每行在括号中还包含了与上一行的时间差异(以秒为单位)。从这个图可以看出,发送ARP请求与收到ARP回答之间的延时是2.2 ms。而在0.7 ms之后发出第一段T C P报文。在本例中,用ARP进行动态地址解析的时间小于3 ms。

最后需要指出的一点,在t c p d u m p命令输出中,我们没有看到s v r 4在发出第一段T C P报文(第4行)之前发出的A R P请求。这是因为可能在s v r 4的A R P高速缓存中已经有b s d i的表项。一般情况下,当系统收到A R P请求或发送A R P应答时,都要把请求端的硬件地址和I P地址存入A R P高速缓存。在逻辑上可以假设,如果请求端要发送I P数据报,那么数据报的接收
端将很可能会发送一个应答。

 

4.5.2 对不存在主机的ARP请求

如果查询的主机已关机或不存在会发生什么情况呢?为此我们指定一个并不存在的I n t e r n e t地址—根据网络号和子网号所对应的网络确实存在,但是并不存在所指定的主机号。从图3 - 1 0可以看出,主机号从3 6到6 2的主机并不存在(主机号为6 3是广播地址)。这里,我们用主机号3 6来举例。

t c p d u m p命令的输出如图4 - 5所示。

这一次,我们没有用-e选项,因为已经知道ARP请求是在网上广播的。

令人感兴趣的是看到多次进行A R P请求:第1次请求发生后5 . 5秒进行第2次请求,在2 4秒之后又进行第3次请求(在第2 1章我们将看到T C P的超时和重发算法的细节)。t c p d u m p命令输出的超时限制为2 9 . 5秒。但是,在t e l n e t命令使用前后分别用d a t e命令检查时间,可以发现Te l n e t客户端的连接请求似乎在大约7 5秒后才放弃。事实上,我们在后面将看到,大多数的BSD实现把完成T C P连接请求的时间限制设置为7 5秒。

在第1 8章中,当我们看到建立连接的T C P报文段序列时,会发现ARP请求对应于T C P试图发送的初始TCPSYN(同步)段。

注意,在线路上始终看不到T C P的报文段。我们能看到的是ARP请求。直到ARP回答返回时,T C P报文段才可以被发送,因为硬件地址到这时才可能知道。如果我们用过滤模式运行t c p d u m p命令,只查看T C P数据,那么将没有任何输出。


4.5.3 ARP高速缓存超时设置

在A R P高速缓存中的表项一般都要设置超时值(在4 . 8小节中,我们将看到管理员可以用a r p命令把地址放入高速缓存中而不设置超时值)。从伯克利系统演变而来的系统一般对完整的表项设置超时值为2 0分钟,而对不完整的表项设置超时值为3分钟(在前面的例子中我们已见过一个不完整的表项,即在以太网上对一个不存在的主机发出A R P请求。)当这些表项再次使用时,这些实现一般都把超时值重新设为2 0分钟。

Host Requirements RFC表明即使表项正在使用时,超时值也应该启动,但是大多数从伯克利系统演变而来的系统没有这样做—它们每次都是在访问表项时重设超时值。

 


4.6 ARP代理

如果A R P请求是从一个网络的主机发往另一个网络上的主机,那么连接这两个网络的路由器就可以回答该请求,这个过程称作委托A R P或A R P代理(Proxy ARP)。这样可以欺骗发起A R P请求的发送端,使它误以为路由器就是目的主机,而事实上目的主机是在路由器的“另一边”。路由器的功能相当于目的主机的代理,把分组从其他主机转发给它。

举例是说明ARP代理的最好方法。如图3 - 1 0所示,系统s u n与两个以太网相连。但是,我们也指出过,事实上并不是这样,请把它与封内图1进行比较。在s u n和子网1 4 0 . 2 5 2 . 1之间实际存在一个路由器,就是这个具有ARP代理功能的路由器使得s u n就好像在子网1 4 0 . 2 5 2 . 1上一样。具体安置如图4 - 6所示,路由器Telebit NetBlazer,取名为n e t b,在子网和主机s u n之间。

当子网1 4 0 . 2 5 2 . 1(称作g e m i n i)上的其他主机有一份I P数据报要传给地址为1 4 0 . 2 5 2 . 1 . 2 9的s u n时,g e m i n i比较网络号(1 4 0 . 2 5 2)和子网号(1),因为它们都是相同的,因而在图4 - 6上面的以太网中发送I P地址1 4 0 . 2 5 2 . 1 . 2 9的ARP请求。路由器n e t b识别出该I P地址属于它的一个拔号主机,于是把它的以太网接口地址1 4 0 . 2 5 2 . 1作为硬件地址来回答。主机g e m i n i通过以太网发送I P数据报到n e t b,n e t b通过拨号S L I P链路把数据报转发到s u n。这个过程对于所有1 4 0 . 2 5 2 . 1子网上的主机来说都是透明的,主机s u n实际上是在路由器n e t b后面进行配置的。

如果在主机g e m i n i上执行a r p命令,经过与主机s u n通信以后,我们发现在同一个子网1 4 0 . 2 5 2 . 1上的n e t b和s u n的I P地址映射的硬件地址是相同的。这通常是使用委托ARP的线索。

gemini % arp -a
                                        这里是子网1 4 0 . 2 5 2 . 1上其他主机的输出行
netb (140.252.1.183) at 0:80:ad:3:6a:80
sun (140.252.1.29) at 0:80:ad:3:6a:80

图4 - 6中的另一个需要解释的细节是在路由器n e t b的下方( S L I P链路)显然缺少一个I P地址。为什么在拨号S L I P链路的两端只拥有一个I P地址,而在b s d i和s l i p之间的两端却分别有一个I P地址?在3 . 8小节我们已经指出,用i f c o n f i g命令可以显示拨号S L I P链路的目的地址,它是1 4 0 . 2 5 2 . 1 . 1 8 3。N e t B l a z e r不需要知道拨号S L I P链路每一端的I P地址(这样做会用更多的I P地址)。相反,它通过分组到达的串行线路接口来确定发送分组的拨号主机,因此对于连接到路由器的每个拨号主机不需要用唯一的I P地址。所有的拨号主机使用同一个I P地址1 4 0 . 2 5 2 . 1 . 1 8 3作为S L I P链路的目的地址。

A R P代理可以把数据报传送到路由器s u n上,但是子网1 4 0 . 2 5 2 . 1 3上的其他主机是如何处理的呢?选路必须使数据报能到达其他主机。这里需要特殊处理,选路表中的表项必须在网络1 4 0 . 2 5 2的某个地方制定,使所有数据报的目的端要么是子网1 4 0 . 2 5 2 . 1 3,要么是子网上的某个主机,这样都指向路由器n e t b。而路由器n e t b知道如何把数据报传到最终的目的端,即通过路由器s u n。

ARP代理也称作混合ARP(p r o m i s c u o u s A R P)或ARP 出租(ARP hack)。这些名字来自于A R P代理的其他用途:通过两个物理网络之间的路由器可以互相隐藏物理网络。在这种情况下,两个物理网络可以使用相同的网络号,只要把中间的路由器设置成一个A R P代理,以响应一个网络到另一个网络主机的A R P请求。这种技术在过去用来隐藏一组在不同物理电缆上
运行旧版T C P / I P的主机。分开这些旧主机有两个共同的理由,其一是它们不能处理子网划分,其二是它们使用旧的广播地址(所有比特值为0的主机号,而不是目前使用的所有比特值为1的主机号)。

 


4.7 免费ARP

我们可以看到的另一个A R P特性称作免费ARP (gratuitous ARP)。它是指主机发送A R P查找自己的I P地址。通常,它发生在系统引导期间进行接口配置的时候。

在互联网中,如果我们引导主机b s d i并在主机s u n上运行t c p d u m p命令,可以看到如图
4 - 7所示的分组。

(我们用- n选项运行t c p d u m p命令,打印出点分十进制的地址,而不是主机名)。对于A R P请求中的各字段来说,发送端的协议地址和目的端的协议地址是一致的:即主机b s d i的地址1 4 0 . 2 5 2 . 1 3 . 3 5。另外,以太网报头中的源地址0 : 0 : c 0 : 6 f : 2 d : 4 0,正如t c p d u m p命令显示的那样,等于发送端的硬件地址(见图4 - 4)。

免费ARP可以有两个方面的作用:

  • 1) 一个主机可以通过它来确定另一个主机是否设置了相同的I P地址。主机b s d i并不希望对此请求有一个回答。但是,如果收到一个回答,那么就会在终端日志上产生一个错误消息“以太网地址: a : b : c : d : e : f发送来重复的I P地址”。这样就可以警告系统管理员,某个系统有不正确的设置。
  • 2) 如果发送免费A R P的主机正好改变了硬件地址(很可能是主机关机了,并换了一块接口卡,然后重新启动),那么这个分组就可以使其他主机高速缓存中旧的硬件地址进行相应的更新。一个比较著名的ARP协议事实[Plummer 1982]是,如果主机收到某个I P地址的ARP请求,而且它已经在接收者的高速缓存中,那么就要用A R P请求中的发送端硬件地址(如以太网地址)对高速缓存中相应的内容进行更新。主机接收到任何A R P请求都要完成这个操作( A R P请求是在网上广播的,因此每次发送ARP请求时网络上的所有主机都要这样做)。

文献[ B h i d e、E l n o z a h y和M o rgan 1991]中有一个应用例子,通过发送含有备份硬件地址和故障服务器的I P地址的免费A R P请求,使得备份文件服务器可以顺利地接替故障服务器进行工作。这使得所有目的地为故障服务器的报文都被送到备份服务器那里,客户程序不用关心原来的服务器是否出了故障。

不幸的是,作者却反对这个做法,因为这取决于所有不同类型的客户端都要有正确的ARP协议实现。他们显然碰到过客户端的ARP协议实现与规范不一致的情况。

通过检查作者所在子网上的所有系统可以发现,SunOS 4.1.3和4 . 4 B S D在引导时都发送免费ARP,但是SVR4却没有这样做。

 


4.8 arp命令

我们已经用过这个命令及参数- a来显示A R P高速缓存中的所有内容。这里介绍其他参数的功能。

超级用户可以用选项- d来删除A R P高速缓存中的某一项内容(这个命令格式可以在运行第4章ARP:地址解析协议使用45
一些例子之前使用,以让我们看清楚ARP的交换过程)。

另外,可以通过选项- s来增加高速缓存中的内容。这个参数需要主机名和以太网地址:对应于主机名的I P地址和以太网地址被增加到高速缓存中。新增加的内容是永久性的(比如,它没有超时值),除非在命令行的末尾附上关键字t e m p。位于命令行末尾的关键字p u b和- s选项一起,可以使系统起着主机A R P代理的作用。系统将回答与主机名对应的I P地址的A R P请求,并以指定的以太网地址作为应答。如果广播的地址是系统本身,那么系统就为指定的主机名起着委托ARP代理的作用。

 


4.9 小结

在大多数的T C P / I P实现中,A R P是一个基础协议,但是它的运行对于应用程序或系统管理员来说一般是透明的。A R P高速缓存在它的运行过程中非常关键,我们可以用a r p命令对高速缓存进行检查和操作。高速缓存中的每一项内容都有一个定时器,根据它来删除不完整和完整的表项。a r p命令可以显示和修改ARP高速缓存中的内容。

我们介绍了A R P的一般操作,同时也介绍了一些特殊的功能:委托A R P(当路由器对来自于另一个路由器接口的A R P请求进行应答时)和免费A R P(发送自己I P地址的A R P请求,一般发生在引导过程中)。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值