5华为IRF技术白皮书-IRF之分布式二层协议
何谓“ IRF
IRF的含义就是智能弹性架构( Intelligent Resilient Framework)。
支持IRF 的多台设备可以互相连接起来形成一个“联合设备”,这台“联合设备”称为一个Fabric,而将组成Fabric的每个设备称为一个Unit(如图1所 示)。多个Unit组成Fabric后,无论在管理还是在使用上,就成为了一个整体。它既可以随时通过增加Unit来扩展设备的端口数量和交换能力,大大 提高了设备的可扩展性;同时也可以通过多台Unit之间的互相备份增强设备的可靠性;并且整个Fabric作为一台设备进行管理,用户管理起来也非常方 便。
简单来说,就是IRF设备通过多个Unit的堆叠形成了用户迫切需要的易管理、易扩展以及高可靠的产品特点。是一种不同于业界现有所有设备的全新理念的网络设备。
图1 Fabric设备示意图
何谓“ IRF 之分布式二层协议”
IRF产品有三个关键特性:
DDM(分布设备管理):外界可以将整个Fabric看成一台整体设备进行管理,用户可以通过CONSOLE、SNMP、TELNET、WEB等多种方式来管理整个Fabric。
DLA(分布链路聚合):支持跨设备的链路聚合,支持LACP协议。可以在设备之间进行链路的负载分担和互为备份。
DRR(分布弹性路由):包含多个Unit的Fabric在外界看来是一台单独的三层交换机。整个Fabric将作为一台设备进行路由功能和转发功能。在Fabric中的某一个Unit发生故障时,整个Fabric的路由协议和数据转发不会中断。
以上这三个关键特性支撑了IRF设备的易管理、易扩展以及高可靠的产品特点,也同时使得IRF设备具有现有业界已有设备无法比拟的应用优势。
本文所要描述的“IRF之分布式二层协议”就是实现或者配合实现上述DDM、DLA、DRR三大特性的技术基础。
IRF 之分布式二层协议”的技术特点及应用价值
随着网络技 术的发展,越来越多的用户需要通过接入设备访问互联网,用户要求设备供应商能够对其网络进行平滑升级和扩容。IRF技术就是在这种应用背景下产生的。通过 IRF技术可以将设备接入端口数进行扩充,最大可以扩充到400个或者更多的端口数,并且向用户提供高可靠、高可扩展性的网络。端口数的无限扩充以及对网 络可靠性要求的提高,这就要求以太网交换机中常用的二层协议,如STP/RSTP/MSTP、LACP、802.1x以及IGMP Snooping等基础协议具备管理大容量端口和高可靠性等功能。
一般对于这种分布式系统,或者框式分布式系统,二层协议的基本实现方式是在主控板或者Master设备上实现,即传统的主从式结构。具体的过程基本上包括下面几个步骤:
1、     端口收到报文后,首先送给本地的CPU;
2、     本地CPU在收到协议报文后,如果判断自己不是Master,则将该报文进行进一步封装,加上入端口号、报文长度等等信息,然后将报文送给Master设备;
3、     Master设备上处理收到的协议报文并且运行协议相关的状态机,得到端口的控制状态或者转发表项;
4、     Master设备再将状态机计算结果通过控制指令下发给各Slave设备,从而完成对整个分布式系统的控制;
5、     Slave设备收到Master下发的控制指令后,根据指令完成对本地交换芯片的配置。
很明显,这 种传统的实现方式将大部分的处理过程放到Master设备处理,增大了Master的负担,因此设备就需要更多的存储器资源和更强劲的CPU,提高了设备 的硬件成本;其次,将所有处理过程放到Master上,降低了整个系统的可靠性,即如果Master出现故障,将会导致整个系统不能正常运行,从而系统很 难具备高可靠性特点。
图2 普通分布式系统的二层协议实现模型
在IRF堆叠系统中,为了降低CPU和存储器资源的消耗,提高系统的可靠性和弹性,对于交换机的常用二层协议,采用分布式的设计思想,简单的说,就是在端口所在的设备上(入侧设备)对该设
备所收到的协议报文进行处理;二层协议相关的状态机统一运行在端口所在的各自设备上,计算结果直接控制该设备的端口;IRF系统内设备之间通过极少量的控制报文进行交互和协商,以做到设备之间的控制过程一致。
IRF 之分布式二层协议”的关键技术点
二层协议对外表现为一台设备
IRF的技术特点之一就是整个IRF系统对于网络中其它设备或者网管来说是一台独立的交换设备,与IRF系统直接相连的设备不会感知到IRF系统内部的结构,也就是说,从周边的设备来看,与其交互的只是一台设备。
IRF系统 中的所有二层协议,对外只有一个设备ID,比如STP/RSTP/MSTP对外发布的是同一个桥ID,对于LACP协议来说,对外发布的是相同的系统 ID;此外,二层协议对IRF内的所有端口进行统一编号,也就是说,IRF系统的端口ID在同一个线性空间内。这样IRF系统周边的设备虽然从不同 UNIT上收到协议报文,但是它们看到的却是同一台设备的不同端口发送出来的协议报文。
作为一台设备进行二层协议的各种配置
要使一个 Fabric中各个Unit上的二层协议的控制过程一致,另外一个基本前提就是每个Unit关于协议的配置是完全一致的。这里的完全一致不仅仅是指配置的 命令完全一致,而且包括配置的时间和时序都完全一致,即用户必须同时在Fabric中的所有Unit上配置完全一致的命令。很显然这个需求靠用户手工在所 有Unit上分别配置命令是无法实现的,因此IRF设备必须实现把整个Fabric作为一台设备进行各种二层协议配置的功能。
这里所说的 把整个Fabric作为一台设备进行各种二层协议配置的功能是指用户可以借助任何手段(包括CONSOLE、SNMP、TELNET、WEB等多种方 式),也可以在Fabric中的任意一个Unit上,进行二层协议的相关配置,只要Fabric中的任意一个Unit收到用户配置,就会马上同步给其余所 有Unit同时执行,从而实现每个Unit关于二层协议的配置完全一致的需求。
图3 Fabric处理二层协议相关配置示意图
UNIT 独立运行二层协议
在IRF系统中,虽然二层协议对外表现为一台独立设备,并且可以当作一个管理实体接收来自网管、控制台的配置命令,但是为了降低系统成本和提供系统可靠性,二层协议的报文处理和状态机运算都是在端口所在设备上进行的。下图为分布式二层协议的实现模型:
图4 IRF系统中分布式二层协议控制模型
分布式二层协议的主要实现原理如下:
1、     IRF系统中,端口收到协议报文后,交给本设备的CPU处理;
2、     端口所在设备对接收到的协议报文进行处理,并且允许端口的协议状态机;
3、     端口所在设备根据需要判断是否需要和IRF系统内的其它设备进行交互,并根据本地状态机和交互结果得到端口的控制状态或者该设备的转发表项;
4、     端口所在设备将计算所得到的端口状态或者转发项设置到该设备上,以指导设备进行二、三层数据报文转发;
5、     分布式情况下,如果计算结果影响其它设备,则通过控制消息将该结果通知给其它设备。
通过该实现 原理可以发现,分布式二层协议只管理设备自身的端口,并且状态机和协议计算只发生在本地。因此二层协议对CPU与存储器资源的需求基本上与IRF系统内的 总端口数无关,此外,由于状态机和协议计算只发生在设备本地,因此当其它设备发生故障时,并不会影响本地设备的协议状态机运行,从而提高了整个系统的可靠 性和稳定性。正是二层协议的这种分布式实现方式,IRF系统对CPU和存储器资源的需求才大大降低,从而使这种低成本、高可靠性、可扩容性技术的实现成为 可能。
链路聚合控制协议( LACP )分布式
LACP在 IRF上采用分布式架构,对于端口信息这样的局部数据,各设备只保存本设备的端口信息,但是对于聚合组这样的全局数据,需要全局集中式管理,所有的聚合组 数据的处理都在Master UNIT上处理,以保证聚合组资源的全局一致性和ASIC聚合的一致性。同时,为了保证Master UNIT离开后系统能够及时恢复业务,对全局聚合资源数据在各UNIT上进行备份。需要注意的是:这些备份数据并不参与正常的LACP流程计算,只是在 Master UNIT离开时起到平滑业务的作用。下面是针对跨设备聚合时的一些实现原理:
1、     在不同的Unit上配置LACP,启动IRF系统内各端口的LACP协议;
2、     各UNIT处理本设备端口收到的LACP协议报文,并且运行状态机与对端进行协商;
3、     协商成功后,各UNIT将协商结果发送给Master设备,Master设备根据该结果分配聚合资源,并且创建聚合组;
端口认证协议( 802.1x )分布式
802.1x 是基于端口的认证协议,每个启动1x功能的端口都需要维持一套状态机,以实现上网认证、在线维持和用户下线处理。802.1x协议是在各UNIT上独立运 行的,当端口收到认证报文后,直接送往本设备CPU处理,本设备通过1x状态机实现与客户端的协商以及对端口授权状态的控制。
IGMP 报文侦听协议( IGSP )分布式
IGMP Snooping 采用对等方式运行,IGMP Snooping协议在所有设备上同时运行,各设备的 IGMP Snooping 实体独立进行协议处理,在周边实体输入相同的情况下各设备的 IGMP Snooping协议会得到相同的二层组播转发表。IGMP Snooping 在每个设备上都维护整个 IRF Fabric 的端口组加入信息,这样在每个设备上都保存有完整的二层转发表,表里保存的转发项都是全局转发项,包含完整的出端口列表。最后,各设备的IGMP Snooping根据该转发表整理出指导芯片转发的转发项,并且配置到ASIC芯片中。
生成树协议( STP/RSTP/MSTP )分布式
在IRF系 统中,STP(含STP/RSTP/MSTP,以下简称STP)协议采用分布式方式运行,STP协议在所有设备上分别运行,各设备只处理自己所包含的外部 端口,但所有设备向外发布自己的BPDU信息时,采用同一个Bridge ID。整个IRF Fabric作为一台801.1D Bridge,其只具有一个Root Port、一批负责向下游转发报文的Designated Port,其它的则被选择为Alternate Port或者Backup Port。
当UNIT 上的STP在确定本UNIT的端口角色时,需要同时考虑位于其它UNIT的Fabric的Root Port。也就是说Fabric上的Root Port将参与所有UNIT的端口角色确定,这样可以防止在同一个Fabric上产生多个Root Port。当某个UNIT上存在Root Port时,它将通过设备间控制消息以广播方式将该信息发布给其它所有UNIT;各UNIT收到该信息后将该信息保存,并触发本地的端口角色计算,以确定 本UNIT各端口的端口角色。
Fabric 的Root Port选择出来后,Root Port需要向Fabric上其它所有端口发布“重新选择根端口”信号,然后检查Fabric的所有端口是否已经都和新的根端口保持信息同步,如果已经同 步,则Root Port可以迁移到Forwarding状态。在向Fabric其它所有端口发布“重新选择根端口”信号时,Root Port所在UNIT通过广播控制消息将“重新选择根端口”信号发布给Fabric的各UNIT,这些UNIT在收到“重新选择根端口”信号后,激励本 UNIT所有端口与Fabric当前的Root Port的端口状态同步,然后各端口成为“已经同步”状态,UNIT向Root Port所在UNIT响应一个本UNIT 同步成功消息。当Root Port收到Fabric其它所有UNIT的同步成功响应,并且本地端口(除Root Port)也都同步成功,则Root Port可以迁移到Forwarding状态。
Fabric 的Root Port在收到上游Designated Port发来的迁移到Forwarding状态请求消息后(Proposal信号),Root Port需要向Fabric其它所有端口发布Sync信号,要求这些端口保持与上游Designated Port状态同步,Fabric各端口收到Sync信号后,调整自己的状态,然后设置自己的状态为Synced(已经同步)。Root Port在发现所有端口都Synced后,向上游Designated Port响应Agreement消息,即同意上游迁移到Forwarding状态。在Fabric内部,Root Port对Sync的处理过程与对“重新选择根端口”的处理过程相同。
当网络的拓 扑变化时(不包含Fabric内部结构的拓扑变化),Fabric的某个端口会收到TC消息或自己状态发生变化,端口所在UNIT通过控制消息将该TC消 息发布给其它所有UNIT,这样保证在端口发现拓扑变化时会根据802.1D的要求刷新Fabric所有相关端口的二层转发信息。
下面结合图例来说明分布式STP协议实现原理:
图5 STP协议分布式实现原理
1.     各设备只保存本地端口的数据和状态机信息;
2.     每台设备维护一个虚拟端口,该端口所保存的信息为分布式系统内当前的根端口信息,如果系统内没有根端口,则该端口所保存的信息可以认为是无效的;
3.     端口收到BPDU报文后,将报文送交本地STP进行处理。STP根据本地端口信息和虚拟端口所保存的信息来选择系统内的根端口;
4.     如果选择的根端口位于本设备,则STP协议将该端口收到的BPDU以及该端口号作为同步消息发送给其他所有设备;
5.     设备如果收到来自其他设备发来的根端口信息时,将该信息保存到本地的虚拟端口上,并且重新触发本地的根端口角色选择,如果自己的根端口信息没有远端根端口信息优时,本地根端口将被选择为可选端口或指定端口;
6.     当被阻塞的根端口需要快速迁移到转发状态时,根端口会向系统内所有端口下发“根端口重新选择”信号,该信号通过同步消息逻辑通道广播到系统内的其他所有端口;
7.     如果设备收到“根端口重新选择”信号,设备会检查本地端口是否已经与该根端口同步,如果没有,则阻塞该端口,然后设备将向根端口所在设备发送“本设备已经同步根端口重新选择”标志;
8.     根端口所在设备收到系统内其他所有设备发来的“本设备已经同步根端口重新选择”标志,并且本地其他端口也全部同步完毕时,根端口直接迁移到转发状态;
9.     当上游指定端口需要迁移到转发状态时,指定端口会向下游发送同步请求消息,此时下游根端口需要向本地所有端口和系统内其他设备发送同步信号,同步信号也是通过同步消息逻辑通道广播给其他所有设备;
10.  当设备收到该同步信号后,在本地执行同步动作,根据需要阻塞潜在冗余端口。同步完毕后,设备会向根端口所在设备发送同步完毕消息;
11.  当根端口所在设备收到系统内其他所有设备的同步完毕消息,并且本地其他端口也已经全部同步完毕,则根端口将向上游指定端口响应同步应答消息;
12.  上游指定端口收到同步应答消息后,会直接迁移到转发状态;
13.  当系统内的某台设备发现拓扑变化或者收到拓扑变化消息,会通过同步消息逻辑通道向其他所有设备发送拓扑变化消息,设备收到该消息后会刷新本地的地址转发信息。
总结
华为 3Com的“IRF之分布式二层协议”技术是业界首次真正实现了以太网交换机的常用二层管理协议的分布式运算,做到了对外表现为一台设备,内部独立计算的 机制,并且其中的一台或几台设备故障时,其它设备仍然能够不间断运行,真正以低成本实现了高可扩展性、高可靠性、易于管理和运营的弹性网络。
6华为IRF技术白皮书 -IRF之分布式弹性路由
何谓“IRF
IRF的含义就是智能弹性架构( Intelligent Resilient Framework)。
支持IRF 的多台设备可以互相连接起来形成一个“联合设备”,这台“联合设备”称为一个Fabric,而将组成Fabric的每个设备称为一个Unit(如图1所 示)。多个Unit组成Fabric后,无论在管理还是在使用上,就成为了一个整体。它既可以随时通过增加Unit来扩展设备的端口数量和交换能力,大大 提高了设备的可扩展性;同时也可以通过多台Unit之间的互相备份增强设备的可靠性;并且整个Fabric作为一台设备进行管理,用户管理起来也非常方 便。
简单来说,就是IRF设备通过多个Unit的堆叠形成了用户迫切需要的易管理、易扩展以及高可靠的产品特点,是一种不同于业界现有所有设备的全新理念的网络设备。
图1 Fabric设备示意图
何谓“IRF 之分布式弹性路由”
IRF产品有三个关键特性:
DDM(分布式设备管理):外界可以将整个Fabric看成一台整体设备进行管理,用户可以通过CONSOLE、SNMP、TELNET、WEB等多种方式来管理整个Fabric。
DLA(分布式链路聚合):支持跨设备的链路聚合,支持LACP协议。可以在设备之间进行链路的负载分担和互为备份。
DRR(分布式弹性路由):包含多个Unit的Fabric在外界看来是一台单独的三层交换机。整个Fabric将作为一台设备进行路由功能和转发功能。在Fabric中的某一个Unit发生故障时,整个Fabric的路由协议和数据转发不会中断。
以上这三个关键特性支撑了IRF设备的易管理、易扩展以及高可靠的产品特点,也同时使得IRF设备具有现有业界已有设备无法比拟的应用优势。
本文所要描述的“IRF之分布式弹性路由”(DRR)作为IRF设备三个关键特性之一,它是IRF设备的实现基础,也是IRF设备中最具亮点和应用价值的特性之一。
“IRF 之分布式弹性路由”的技术特点及应用价值
自网络设备诞生起,设备的可靠性一直是各个厂商竭力攻关的课题。到目前为止,随着各种技术的不断进步,设备的可靠性方面也确实有了大幅度的提升,但是最能使设备可靠性得到质的飞跃的技术“路由协议热备份”,却由于其无法想象的复杂性,成了困扰业界各个厂商悬而未决的难题。
“路由协议 热备份”之所以复杂,是因为其具有复杂多变的各种协议状态机,并且具有庞大而多变的链路信息库(LSDB),要想通过设备间的热备份实现几台设备上各种协 议状态机以及LSDB的严格同步是非常困难的。而“路由协议热备份”之所以重要,是因为一旦解决了这个难题,就可以实现在不中断路由协议和业务的情况下轻 松切换工作设备,也就可以轻松实现网络平滑升级、设备故障智能保护等客户急需的特性需求,从而实现在各种情况下网络业务的无中断运行。
华为 3Com的“IRF之分布式弹性路由”技术是业界首次真正实现“路由协议热备份”的技术,做到了同一个Fabric中各个Unit上路由信息的严格同步, 并且在其中一个或多个Unit出现故障的时候,其它Unit可以照常运行并迅速接管故障Unit的功能,此时,路由协议不会随之出现中断,二/三层转发流 量和业务也不会出现中断,从而实现了真正意义上的不中断路由协议、不中断业务的故障保护和设备切换功能。
另外,华为3Com的“IRF之分布式弹性路由”还将实现一个非常重要的功能,那就是“分布式三层转发”,它在业界首次改变了普通堆叠设备的三层转发模式,是具有重大创新意义的全新“分布式三层转发”流程。
在业界现有的设备中,一般堆叠设备的三层转发模式如图2所示:
图2 普通堆叠设备三层转发示意图
即堆叠设备中只有主单元设备具有三层转发能力,其余单元设备在收到三层报文后必须交给主单元设备(图2中的unit1)进行三层转发。
而采用华为3Com的“IRF之分布式弹性路由”技术后实现的“分布式三层转发”流程如图3所示:
图3 采用“IRF之分布式弹性路由”技术后三层转发示意图
即实现了 “IRF之分布式弹性路由”技术后,Fabric上任意一个Unit都有完整的三层转发能力,当它收到待转发的三层报文时,可以通过查询本Unit的三层 转发表得到报文的出接口以及下一跳,然后将报文从正确的出接口送出去,这个出接口可以在本Unit上也可以在其它Unit上,并且将报文从一个Unit送 到另外一个Unit是一个纯粹内部的实现,对外界是完全屏蔽的,即对于三层报文来说,不管它在Fabric内部穿过了多少Unit,在跳数上只增加1,即 表现为只经过了一个网络设备。
“IRF 之分布式弹性路由”的关键技术点
作为一台设备管理所有三层接口
设备上存在 UP的三层接口是运行路由协议的基础,也是网络设备能够进行报文三层转发的前提条件。要使一个Fabric中各个Unit上的路由协议各种信息保持一致, 最基本的前提就是每个Unit的三层接口必须保持完全一致。在华为3Com的IRF技术体系里,Fabric上的三层接口是一个全局的概念,它不属于某一 个Unit,而是属于整个Fabric,一个Fabric作为一台设备管理本Fabric上所有三层接口,每一个三层接口在Fabric是具有唯一性的, 对于Fabric中任意一个Unit来说,它看到的都是由Fabric统一维护的全局的三层接口,因此每一个Unit看到的结果都是一样的。这也就满足了 Fabric中每个Unit的三层接口必须保持完全一致的需求。
作为一台设备进行路由协议的各种配置
要使一个 Fabric中各个Unit上的路由协议各种信息保持一致,另外一个基本前提就是每个Unit关于路由协议的配置是完全一致的。这里的完全一致不仅仅是指 配置的命令完全一致,而且包括配置的时间和时序都完全一致,即用户必须同时在Fabric中的所有Unit上配置完全一致的命令。很显然这个需求靠用户手 工在所有Unit上分别配置命令是无法实现的,因此IRF设备必须实现把整个Fabric作为一台设备进行路由协议各种配置的功能。
这里所说的 把整个Fabric作为一台设备进行路由协议各种配置的功能是指用户可以借助任何手段(包括CONSOLE、SNMP、TELNET、WEB等多种方 式),也可以在Fabric中的任意一个Unit上,进行路由协议的相关配置,只要Fabric中的任意一个Unit收到用户配置,就会马上同步给其余所 有Unit同时执行,从而实现每个Unit关于路由协议的配置完全一致的需求。
图4 Fabric处理路由协议相关配置示意图
作为一台设备运行路由协议
把多个 Unit堆叠起来组成一个Fabric在网络中运行时,将不可避免的遇到一个冲突问题:即所有的Unit都会发送路由协议报文,都会分别和外界设备进行路 由信息交互,因此外界设备看到的将是多个设备,而不是Fabric本身一个设备,而同时由于各个Unit上的三层接口以及IP地址是完全一致的,外界设备 就会收到来自同一个接口同一个IP地址的多个路由协议报文(分别由各个Unit发出),从而不可避免的造成冲突问题。
要解决这个 冲突问题,就必须让Fabric只发出一份路由协议报文来,即让整个Fabric作为一台设备运行,采取的办法是从所有Unit中选出一个Unit来发送 路由协议报文,其它Unit发送的路由协议报文都将被抑制,因此从外界看来,整个Fabric只发出一份路由协议报文来,就像只有一台设备在运行路由协议 一样。
下文图5中 以RIP协议为例对华为3Com的方案进行了简要说明,图5中Unit1和Unit2组成了一个Fabric,这个Fabric从Unit1和Unit2 分别收到了RIP协议报文,并且Unit1和Unit2都向外界发送了RIP协议报文,但是只有Unit1的报文被成功发送出去,而Unit2的RIP协 议报文被Fabric系统在内部抑制,从而对于外界设备来说,整个Fabric只发出一份路由协议报文来。
图5 Fabric收发路由协议报文示意图
静态路由协议的热备份
静态路由协议的热备份相对比较简单,因为所有静态路由都是通过配置产生的,只要实现上文所说的把Fabric作为一台设备进行配置的功能,即用户配置的任何一条命令都会在所有Unit上同时执行,那么每一个Unit根据配置命令产生的静态路由也是完全一致的。
RIP 路由协议的热备份
RIP路由协议是目前各种路由协议中相对比较简单的协议,它没有复杂的协议状态机,只是根据RIP协议报文来互相交互路由信息,因此只要让Fabric中的每一台Unit处理的RIP协议报文完全一致就可以保证每一台Unit上生成的RIP路由完全一致。
要实现这个 功能,就必须要保证Fabric中的每一台Unit在相同的时间,以相同的时序收到完全相同的协议报文,并且处理该协议报文的所有前提条件(例如接口状态 等)都是完全一致的。采取的办法是在所有Unit各种协议状态完全一致的情况下,任意一个Unit收到外界传来的RIP协议报文就马上同步给其它所有 Unit,让Fabric中的所有Unit上同时能处理到同样的RIP协议报文,从而保证每个Unit生成RIP路由的一致性。
OSPF 路由协议的热备份
OSPF是 目前网络上应用最广的路由协议之一,同时也是最复杂的路由协议之一。它包含Down、Loopback、Waiting、Point-to-point、 DR Other、Backup、DR等七个接口状态以及Down、Attempt、Init、2-Way、ExStart、Exchange、 Loading、Full等八个邻居状态,另外还包括Router-LSAs、Network-LSAs、Summary-LSAs (IP network)、Summary-LSAs (ASBR)、AS-external-LSAs、type-7 LSA(NSSA)等各种类型的LSA以及HELLO(Hello Packets)、DD(Database   Description Packets)、LSR(Link State Request Packets)、LSU(Link State Update Packet)、LSAck(Link State Acknowledgment Packet)等五大类协议报文,最关键的是OSPF的各种接口状态、邻居状态以及相关报文处理都是环环相扣的关系,它们之间互相作用互相推进并互相限 制,任何状态以及相关时序的混乱都会导致OSPF邻居无法成功建立,网络无法及时得到收敛。所以要使得Fabric中各个Unit上各种OSPF路由信息 保持完全一致、各种OSPF协议状态保持完全同步是一个非常复杂且庞大的工程。
华为3Com凭借多年深厚的技术积累以及相应开发团队的不断努力,终于攻克了上文提到的难题,在业界首次成功完成了OSPF协议热备份的开发工作,并且经受住了反复测试以及实验局的考验,在功能和性能上都取得了非常好的效果。
采用华为3Com的这种技术后可以轻松切换工作设备、并且整个切换过程快速、平滑,不会引起OSPF邻居关系的重建和路由振荡。因此可以说是首次在业界实现了切换工作设备时不中断路由协议、不中断业务的真正协议热备份。
华为3Com这次自主研发并具有独立知识产权的OSPF协议热备份技术主要由以下几个关键技术点组成:
1、OSPF IRF的协议报文处理以及FLOOD过程
上文“作为 一台设备运行路由协议”一节中已经描述了在Fabric中各个Unit上的路由协议报文的发送过程,即采取的办法是从所有Unit中选出一个Unit来发 送路由协议报文,其它Unit发送的路由协议报文都将被抑制,这样做的目的是使得整个Fabric只发出一份路由协议报文来,对于外界设备来说,就像只有 一台设备在运行路由协议一样。
2、OSPF IRF的接口状态实时备份
OSPF的 正常运行是通过状态机来推动的。状态机包括接口和邻居状态机。接口状态机是OSPF成功建立邻居关系以及正确处理协议报文的前提,为了保证切换工作设备时 做到平滑、可靠,不中断路由协议的正常运行,则必须保证切换前后接口状态的一致性,所以必须保证Fabric中所有Unit上接口状态的严格同步。
针对以上问题,华为3Com推出了OSPF IRF的接口状态实时备份技术。它采用了华为3Com自主研发的具有独立知识产权的Unit间数据备份技术(XHA),能够有效保证备份数据的时序性以及可靠性,使得Fabric中所有Unit上接口状态的严格同步成为可能。
3、OSPF IRF的邻居状态实时备份
为了保证切换工作设备时的平滑、可靠,并且在切换的时候不引起OSPF邻居状态的动荡和变化,所以也必须保证Fabric中所有Unit上邻居状态的严格同步。
邻居状态热备份同样采用了XHA技术进行备份数据的传送,保证了Fabric中各个Unit上邻居状态的严格一致。
下文图6对 OSPF IRF接口状态以及邻居状态的实时备份过程作了简要说明。Unit1作为OSPF主工作设备,接收并处理所有OSPF协议报文,并随时把接口状态和邻居状 态的变化通过实时备份数据的形式发送给Unit2,从而保证了Fabric内部各个Unit上各种协议状态机的一致性。
图6 Fabric内部OSPF接口状态及邻居状态实时备份过程示意图
4、OSPF IRF的LSA实时备份
LSA是路 由计算的基础,要使得Fabric中各个Unit上计算出来的路由一致,则必须保证Fabric中各个Unit上LSA的一致性。同样也只有在 Fabric中各个Unit上LSA以及计算出来的相应路由保持一致的前提下,切换工作设备时才能够有效避免路由振荡,才能做到网络业务的真正无中断运 行。
华为3Com推出了OSPF IRF的LSA实时备份技术。它既有效的保证了备份数据的时序性以及可靠性,并且备份数据量以及占用的系统资源都非常少,使得Fabric能够轻松实现各个Unit上LSA的一致性。
5、OSPF IRF的重传列表实时备份
为了保证切 换工作设备时的平滑、可靠,并且在切换的时候不引起OSPF邻居状态的动荡和变化,并同时保证网络内路由的延续性和准确性,还必须要考虑OSPF的重传列 表备份问题。因为如果Fabric内各个Unit上OSPF重传列表不一致,切换工作设备后就有可能造成部分LSA不会被重传给外界邻居,而外界邻居由于 丢失了这部分LSA就会造成网络内各台设备之间LSDB的不同步,从而失去了OSPF赖以生存的基础,严重影响到网络内OSPF路由的完整性及准确性,从 而无法实现切换设备后网络业务的无中断运行。
重传列表由于其出现的频繁性及短暂性,想要通过由主设备发送实时备份数据给其它Unit的方式来实现各个Unit上重传列表的一致性是非常困难的。
华为3Com通过特有的重传列表备份技术解决了以上难题,做到了Fabric中各个Unit上重传列表的严格一致,使得切换工作设备时的平滑、可靠成为可能。
Unit 加入的处理
为了让IRF设备的平滑无缝升级成为可能,就需要在新Unit加入时做出复杂的处理,使得新Unit的加入不会中断或影响设备上路由协议和网络业务的正常运行,并且能够迅速融入整个Fabric进行工作,使得Fabric的端口数量和交换能力得到大大提升。
让新 Unit在不中断或影响设备上运行的路由协议的情况下迅速融入Fabric有很多难题。第一,它需要学到在它加入之前用户在Fabric上的所有配置;第 二,它需要学到整个Fabric上的所有三层接口;第三,它需要学到整个Fabric上各种路由协议的全部路由信息,即它需要在短时间内与Fabric上 所有其它Unit上的路由信息保持完全一致(这里的路由信息不仅仅时指路由表,还包括路由协议的各种协议状态机、接口状态机以及链路信息库等)。
为了解决这些难题,华为3Com推出了一系列极具创新性的技术。
第一,         推出了设备间配置恢复技术:当Fabric探测到有新Unit加入时,立即启动设备间配置恢复流程,使得在新Unit加入之前的Fabric上的所有配置 都被成功恢复到新Unit上,从而使得新Unit在极短的时间内做到与Fabric上所有其它Unit配置信息的一致性。
第二,         推出了设备间的三层接口恢复技术:当Fabric探测到有新Unit加入时,立即启动设备间的三层接口恢复流程,使得在新Unit加入之前的Fabric 上的所有三层接口都被成功恢复到新Unit上,从而使得新Unit能够与其它Unit一样拥有整个Fabric上的所有三层接口。
第三,         推出了设备间路由协议批量备份技术:当Fabric探测到有新Unit加入时,立即启动设备间路由协议批量备份流程,Fabric会将正在运行的各个路由 协议的所有路由信息批量备份给新Unit,包括路由协议的各种协议状态机、接口状态机以及链路信息库等,以OSPF为例,就需要备份OSPF全局数据、所 有区域的相关数据、所有接口的状态机及相关数据、所有邻居的状态机及相关数据、所有LSA以及重传列表等。通过设备间的路由协议批量备份使得新Unit在 短时间内迅速与Fabric上所有其它Unit上的路由信息保持完全一致,从而为Fabric在后续长期运行中各个Unit上路由信息保持完全一致奠定坚 实基础。
Unit 离开的处理
同样,为了让IRF设备的故障智能保护成为可能,就需要使Fabric能够自动探测各个Unit上故障的发生,并作出及时处理,使得一个或几个Unit的故障不会中断或影响Fabric上路由协议和网络业务的正常运行。
由于不管是 Fabric内部线路故障或者Unit本身发生故障,都表现为某个或者某些Unit不能正常工作,Fabric通过内部探测协议可以发现这些不能正常工作 的Unit,并把这些Unit从Fabric中剔除出去,所以对于Fabric中的其它正常Unit来说,它们感觉到的是某个或者某些Unit离开了 Fabric,因此这种故障智能保护的处理归根结蒂也就是对Unit离开事件的处理。
当Fabric 探测到某个或者某几个Unit离开时,立即通知给其它Unit,由于Fabric中各个Unit上的路由信息是完全一致的,因此剩下的Unit可以无缝的 接管离开的Unit的工作。对于整个Fabric来说,所有路由协议信息都没有改变,例如OSPF的接口状态机以及邻居状态机都没有改变,因此不需要与外 界设备进行重新协商;OSPF的所有链路信息库也是完整的,因此也不会出现丢失路由现象。因此,在不能正常工作的故障Unit离开Fabric的时候,路 由协议不会随之出现中断,二/三层转发流量和业务也都不会出现中断,从而真正意义上实现了设备故障的智能保护。
以图7为例,Unit1发生故障后,Unit2可以无缝的接手Unit1的工作,Fabric上所有正在运行的路由协议OSPF/RIP都不会受到影响,对于外界设备来说,根本感觉不到Fabric上有故障发生。
图7 Fabric故障保护示意图
统一的三层转发表
上文在 “IRF之分布式弹性路由的技术特点和应用价值”一节中提到IRF设备还有一个非常重要的特性,那就是实现三层报文的分布式转发,即实现了“IRF之分布 式弹性路由”技术后,Fabric上任意一个Unit都有完整的三层转发能力,当它收到待转发的三层报文时,可以通过查询本Unit的三层转发表得到报文 的出接口以及下一跳,然后将报文从正确的出接口送出去,这个出接口可以在本Unit上也可以在其它Unit上,并且将报文从一个Unit送到另外一个 Unit是一个纯内部实现,对外界是完全屏蔽的,即对于三层报文来说,不管它在Fabric内部穿过了多少Unit,在跳数上只增加1,即表现为只经过了 一个网络设备。
要实现上述 功能有一个难题:那就是怎样让每个Unit都具有完全一样的三层转发表,因为虽然每个Unit上的路由信息都一样,但是它们进行路由计算的时间并不能保持 完全一致,因此并不能保证各个Unit在任何时刻的三层转发表都完全一致。为了解决这个问题,华为3Com推出了设备间的三层转发表同步技术。
以图8为 例, Unit1和Unit2组成了一个Fabric,它们都会根据本Unit上的路由信息进行路由计算并生成路由表,但只有Unit1生成的路由表会被下刷到 三层转发表,Unit2上的三层转发表是由Unit1同步而来的,这样Fabric中各个Unit上的三层转发表就可以在任何时刻都保持完全一致。
20061319515393.gif
图8 Fabric三层转发表示意图
总结
华为 3Com的“IRF之分布式弹性路由”技术是业界首次真正实现“路由协议热备份”的技术,做到了同一个Fabric中各个Unit上路由信息的严格同步, 并且在其中一个或多个Unit出现故障的时候,其它Unit可以照常运行并迅速接管故障Unit的功能。此时,路由协议不会随之出现中断,二/三层转发流 量和业务也不会出现中断,从而实现了真正意义上的不中断路由协议、不中断业务的故障保护和设备切换功能。
另外,华为3Com的“IRF之分布式弹性路由”技术在业界首次改变了普通堆叠设备的三层转发模式,实现了具有重大创新意义的全新“分布式三层转发”流程,使得Fabric上任意一个Unit都有完整的三层转发能力,从而大幅度提升了堆叠设备的转发能力和产品性能。
总之,采用了“IRF之分布式弹性路由”技术的IRF设备,通过多个Unit的堆叠形成了用户迫切需要的易管理、易扩展以及高可靠、强转发能力的产品特点。是一种不同于业界现有所有设备的全新理念的网络设备。它必将在日新月异的数据通信网络建设大潮中大显身手。
7华为IRF技术白皮书-IRF技术综述
IRF( Intelligent Resilient Framework),即智能弹性架构,是华为3Com公司推出的创新性建设网络核心的新技术。它将帮助用户设计和实施高可用性、高可扩展性的千兆以太网核心和汇聚主干。
运用IRF 技术,可以将多台千兆三层交换机互联在一起,形成分布式交换架构,并作为一个逻辑交换实体运行。从管理和配置的角度看,一个分布式交换架构看起来就像一台 交换设备;从性能的角度看,分布式交换架构中的每台交换机都能针对其端口上的第二层/第三层流量通信业务制定本地转发决策,它向用户提供一种新型的堆叠技 术。
支 持IRF的多台交换设备可以互相连接起来形成一个“联合设备”,我们将这台“联合设备”称为一个fabric,而将组成fabric的每个设备称为一个 unit。多个unit组成fabric后,无论在管理还是在使用上,就成为了一个整体。也就是说,用户可以将这多台设备看成单一设备进行管理和使用。这 样既可以通过增加设备来扩展端口数量和交换能力,同时也通过多个unit之间的相互备份增加了整个fabric的可靠性。
IRF交换机
和传统的堆 叠技术相比,IRF是一种更为增强的堆叠技术,在多方面进行了创新或增强,除了可以做到扩展端口、统一管理之外,IRF在高可靠性、冗余备份方面比照传统 堆叠有了很大的提高。IRF技术可以容许全局范围内的跨设备链路聚合,提供了全面的链路级保护。同时IRF技术实现了跨设备的三层路由冗余,可以支持多种 单播路由协议、组播路由协议的分布式处理,真正实现了多种路由协议的热备份技术,这些方面都是传统堆叠技术难以做到的。尤其是单播路由协议和组播路由协议 的热备份技术,在业界一直都是一个难题,IRF技术的出现对高可靠性提出了全新的解决方案。此外,IRF技术实现了二层协议在fabric内的分布式运 行,提高了堆叠内unit的利用率和可靠性,减少了设备间的协议的依赖关系。
具体来说,IRF主要包括3个技术方面:DDM、DRR和DLA。
*         DDM(分布式设备管理):在外界看来,整个fabric是一台整体设备。用户可以通过CONSOLE、SNMP、TELNET、WEB等多种方式来管理整个fabric。
*         DRR(分布式冗余路由):fabric的多个设备在外界看来是一台单独的三层交换机。整个fabric将作为一台设备进行路由功能和二三层转发功能。单 播路由协议和组播路由协议分布式运行并完全支持热备份,在某一个设备发生故障时,路由协议和数据转发都不会中断。
*         DLA(分布式链路聚合):支持跨设备的链路聚合,可以在设备之间进行链路的负载分担和互为备份。
高可靠性
随着网络规模的不断发展和应用范围的日益广泛,网络设备的可靠性变得越来越重要,IRF技术的出现将给高可靠性以全新的阐释。
一个IRF 设备,是由多个支持IRF特性的单机设备堆叠而成的。由于支持分布式设备管理(DDM)、分布式弹性路由(DRR)、分布式链路聚合(DLA)等功能,使 得一个IRF设备内部的任何一个单机设备的故障,都不会影响到整个IRF设备的功能。IRF技术本身就避免了单点故障的发生,不需要在组网设计上再使用其 它的设备作冗余备份,从而实现了使用更低的成本和更简化的组网设计得到更可靠的网络。
冗余备份
IRF技术实现了1:N的冗余备份。
所谓1:N的冗余备份,就是在fabric内一台设备出现故障的时候,其它设备可以照常运行并迅速接管故障设备的功能。此时,域内路由协议不会随之出现中断;通过跨越设备的聚合,通信链路也得到了完善的保护;转发流量和大部分业务都不会出现中断。
fabric 内的任何unit都可以作为fabric的主设备,完成fabric的转发表的下刷、配置命令的下发等工作。当fabric内被选举的主设备发生故障,就 会在fabric内剩余的unit中重新选举一台unit作为新的主设备运行,继续承担fabric的工作。
路由的热备份
相对于传统的设备组网,IRF提供了真正的单播路由协议和组播路由协议的热备份。并且用户不需要花一半的投资专门用在备份设备上面,IRF中所有的设备都实际参与业务运行。IRF是在提供业务的同时进行备份。
DRR实现 了路由协议热备份的技术,做到了同一个fabric中各个unit上路由信息的严格同步,并且在其中一个或多个unit出现故障的时候,其它unit可以 照常运行并迅速接管故障unit的功能,此时,域内路由协议不会随之出现中断,二/三层转发流量和业务也不会出现中断,从而实现了真正意义上的不中断路由 协议、不中断业务的故障保护和设备切换功能。
IRF的分布式弹性路由
链路的备份
分布式的聚 合技术进一步消除了聚合设备单点失效的问题,提高了聚合链路的可用性。由于聚合成员可以位于系统的不同设备上,这样即使某些成员所在的设备整个出现故障, 也不会导致聚合链路完全失效,其它正常工作的unit会继续管理和维护剩下的聚合端口的状态。这对于核心交换系统和要求高质量服务的网络环境意义重大。
分布式链路聚合(DLA)
DLA技术 允许IRF网络核心外的其他交换机等设备以多宿主的方式接入IRF网络核心,极大提高了全网的可用性。通过多条聚合链路流向IRF网络核心的流量将均匀分 布在聚合链路上,当某一条聚合链路失效时,DLA能够将流量自动重新分布到其余聚合链路以实现链路的弹性备份和提高网络可靠性。
高性能
由于IRF 设备是由多个支持IRF特性的单机设备堆叠而成的,IRF设备的交换容量和端口数量就是IRF内部所有单机设备交换容量和端口数量的总和。因此,IRF技 术能够通过多个单机设备的堆叠,轻易的将设备的核心交换能力、用户端口的密度扩大数倍,从而大幅度提高了设备的性能。
扩展性
IRF技术最大支持八台设备的堆叠,用户可以按照自身的需要购买IRF交换机。由于业务的需要,如果用户需要扩展网络的容量,只需要堆叠更多的IRF交换机,就可以达到扩容的目的。IRF技术极大的保护了用户以前的投资,提高用户的投资效率。
分布式设备管理
支持IRF技术的多台设备可以被看成是一台统一的设备来管理。
用户将一个fabric当成一台整体设备进行管理
高效的配置管理
IRF技术 最多可以连接8台设备组成一个fabric,无论是管理特性、还是转发特性,在用户看来,fabric就像是一台设备在运行。组成fabric的每台设备 具有相同的桥MAC地址,单一管理IP地址和三层转发地址。用户无论通过何种方式(console口、telnet、snmp)连接到fabric内的一 台设备上,对fabric的配置只需要执行一次,fabric内的所有设备都将得到配置。
软件版本升级
相对于以前的简单堆叠,对堆叠体内多台单机进行软件升级的操作将要执行多次,而IRF交换机,通过WEB网管,用户只需要执行一次操作,就可以实现fabric内所有unit的软件的自动升级。
设备的热插拔
组成fabric的设备可以任意的插入和拔出,而不会影响当前fabric的正常运行。
当一台设备 通过堆叠线接入到一个正在运行的fabric内,原有的fabric就会检测到新的设备,同时验证新设备是否可以加入到fabric,如果验证通过,新加 入的设备将会得到原有的全局配置信息和转发信息,同时将自己设备特有的配置和转发信息散发到fabric内,经过短暂的信息交互后,新加入的设备就可以参 与转发了。而这个过程丝毫没有影响原有设备转发过程。当然,这个过程也可以是两个现有的fabric进行合并,现有的转发不会受到影响。
当从fabric断开一台或者多台unit,和该设备相关的配置、转发信息将被从剩余的设备内删除,从而不会造成转发失败。
同时,分离 出去的unit可能会自己形成一个新的fabric,由于fabric内所有的配置都是相同的,如果原来配置有三层接口,分离出去的fabric可能会和 原来的fabric发生IP地址冲突,即在网络中不同的设备上有相同的IP地址配置。为了避免这种情况发生,IRF使用Resilient Arp技术,探测fabric发生分离的unit之间是否存在IP地址冲突,如果存在,则把其中之一的设备降为二层设备使用,避免冲突而引起网络路由的振 荡。
分布式二层协议
组成IRF的多台交换机就像一台设备在运行,当然这也包括很多协议的运行。
IRF交换机支持的多数协议,例如RSTP、IGMP-SNOOPING、LACP等,这些协议都是分布运行在fabric内的各个设备上,每个设备独立运行协议,与外部协议实体进行交互;同时为了保持IRF作为一个整体运行,unit之间完成必要的信息交互。
在外界看 来,组成IRF的各个设备好像是一个协议实体在运行,而在内部,各个协议分布运行在IRF的各个设备上,每个设备都独立承担本设备的协议计算,协议在 fabric内负载分担运行,这样不仅提高了设备的利用率,同时,由于是分布式运行,每台设备上只需要保留本unit的信息,任何一台设备上不需要 fabric完整的协议状态信息,节省了大量的设备间备份操作。另外,fabric内任何unit发生故障,由于协议分别独立运行,相互之间的依赖关系不 强,只需要简单操作,就可以恢复设备的正常运转。
传统堆叠IGMP报文
运行在 IRF交换机上的IGMP-snooping,每个unit都只维护本unit上的路由器端口、主机端口,但是并不关心其它unit上的端口号。如果本设 备接收到IGMP主机加入报文,表明该设备需要转发多播数据,本unit就向fabric内其它unit发送一份通知消息,告诉fabric内其它 unit需要向此unit转发数据,如果该设备以后再次收到相同组播组的主机加入消息,就不会再通知fabric其它unit 了。实现按需转发IGMP报文,在fabric内减少IGMP协议报文的拥塞冲突。
IRF堆叠设备中IGMP报文
分布式转发
fabric内的设备通过堆叠口连接在一起,堆叠的连接方式可以是多种多样的:串行连接、环形连接以及星型连接。
如果采用环 形连接,而且报文需要从fabric内其它unit转发出去,那么收到报文的unit一般会有两条路径选择将报文转发到出端口所在的unit上。IRF在 进行转发时,会选择一条距离出端口所在unit最近的路径转发。这种最短路径的转发方式,比起单向的转发,不仅效率高,而且可以起到负载分担的作用。
IRF技术完全实现了报文的分布式转发,无论是二层报文交换,还是三层报文的路由,都能够做到分布式转发。分布式的转发最大限度地利用了fabric内unit的带宽。
二层转发
在fabric 内每台unit上,有足够的二层转发表项,指导报文在本地完成交换,而无需再经过第三方的处理。当fabric内一台unit接收到转发报文,通过查找自 己的二层转发表,就可以得到转发的出端口,这个端口可以是本地端口,也可以其它unit上的端口。如果出端口是本unit上的端口,则直接交换出去;如果 是其它unit上的端口,则通过堆叠口转发到相应的unit上,再交换出去。但是无论端口是在本地,还是在其它unit上,转发过程只需要一次查询二层转 发表,就可以被交换出去。
在fabric 内任何unit接收到转发报文,都会在本unit上进行源MAC地址学习,就像其它任何交换机所作的一样;但是,无论fabric内有多少台设备,IRF 交换机必须表现的像一台交换机在工作一样,那么,在一台unit上学习的二层转发表项,fabric内的其它unit也必须有,否则,报文就会在VLAN 内广播。为了实现fabric内二层分布式转发,而且IRF内的交换机表现的象一台设备一样,当一台unit新学习到MAC表项以及用户配置的MAC表 项,都需要同步到fabric内的其它设备上。当fabric发生变化,例如加入一台新的unit,新的unit需要获取原fabric的转发表项,同时 将自己的转发表项同步到原fabric内。如果有unit离开,则需要把和此unit相关的表项从fabric内删除掉。
三层转发
同二层转发 类似,IRF交换机实现了分布式的三层转发,即fabric上任意一个unit都有完整的三层转发能力,当它收到待转发的三层报文时,可以通过查询本 unit的三层转发表得到报文的出接口以及下一跳,然后将报文从正确的出接口送出去,这个出接口可以在本unit上也可以在其它unit上,因为 fabric始终是作为一台设备进行工作的,任何一个unit上的接口都是fabric上的接口,将报文从一个unit送到另外一个unit是一个纯内部 实现,对外界是完全屏蔽的,即对于三层报文来说,不管它在fabric内部穿过了多少unit,在跳数上只增加1,即表现为只经过了一个网络设备,在 fabric内部的报文传递是不会改变报文的三层属性的。因此对于外界设备来说,fabric始终就是一台设备。
分布式三层转发
不管转发出端口是在本地,还是在fabric内其它设备上,通过在本地一次查找路由转发表,报文就可以实现三层转发任务。相对于集中式的转发,减少了对单台设备的依赖,同时减轻设备的转发负载。
组播转发
组播数据转发是影响网络带宽的祸首,如何合理有效的处理组播数据转发是困扰业界的一个难题。
同传统的堆叠技术和多台单机互联设备相比,使用IRF技术堆叠的设备,可以做到按需转发组播数据报文,减少设备间组播数据流量。
IRF交换 机将三层组播转发表和分布式IGMP-snooping有机的结合后,产生了交换上引导组播数据转发的二三层结合的组播数据转发表。该组播转发表只维护本 unit上的用户出端口和fabric内其他unit上出端口的unit号,而且只记录出端口所在的unit号,并不关心具体的端口号。这种高效的转发表 从根本上解决了组播数据占用带宽的问题,保证了设备间只有一份报文传送。
传统堆叠的组播数据转发
IRF的组播数据转发
总结
IRF技术是一种分布式的网络技术,它使网络的构建者们能够构建具备高可用性和可伸缩性的网络核心,其性能、配置能力和可伸缩性都可以与网络同步增长,从而避免了集中式网络核心设备所需要面对的一次性较大投入以及物理限制等问题。
8华为IRF技术体系
一、IRF技术概述      IRF智能弹性架构,是华为3Com公司融合高端交换机的技术,在中低端交换机上推出的创新性建设网络核心的新技术。它将帮助用户设计和实施高可用性、高 可扩展性和高可靠性的千兆以太网核心和汇聚主干。     IRF 是Intelligent Resilient Framework的简称,即智能弹性架构。在使用上,IRF和传统的三层堆叠技术有一点类似。简单来说,就是支持IRF的多台交换设备可以互相连接起来 形成一个“联合设备”,我们将这台“联合设备”称为一个Fabric,而将组成Fabric的每个设备称为一个Unit。多个Unit组成Fabric 后,无论在管理还是在使用上,就成为了一个整体。也就是说,用户可以将这多台设备看成一台单一设备进行管理和使用。这样既可以通过增加设备来扩展端口数量 和交换能力,同时也通过多台设备之间的互相备份增强了设备的可靠性。(见图) 图1  IRF的典型组网     IRF技术是由传统三层堆叠技术发展而来的,它不仅完全继承了传统三层堆叠技术可以扩展端口、统一三层交换、统一管理的特点。而且在协议分布式运行、高可 靠性、冗余备份等方面,IRF技术比传统三层堆叠技术有了本质性的提高。     IRF技术可以支持跨设备的链路聚合,提供了完善的链路级保护,并且支持以太网交换机上STP、RSTP、LACP等各种二层协议的分布式运行。IRF技 术同时支持各种单播路由协议、组播路由协议的分布式处理,可以做到跨设备的三层路由冗余,真正实现了多种路由协议的热备份技术。这些方面都是传统堆叠技术 所难以企及的。尤其是单播路由协议和组播路由协议的热备份技术,这在是一直一来困扰业界的一个难题,IRF技术的出现对路由协议的热备份提出了全新的解决 方案。 具体来说,IRF主要包括3个技术方面:DDM、DRR和DLA。 *         DDM(分布设备管理):在外界看来,整个Fabric是一台整体设备。网络管理员进行管理,用户可以通过CONSOLE、SNMP、TELNET、WEB等多种方式来管理整个Fabric。 *         DRR(分布冗余路由):Fabric的多个设备在外界看来是一台单独的三层交换机。整个Fabric将作为一台设备进行路由功能和二三层转发功能。单播 路由协议和组播路由协议分布式运行并完全支持热备份,在某一个设备发生故障时,路由协议和数据转发都可以不中断。 *         DLA(分布链路聚合):支持跨设备的链路聚合,可以在设备之间进行链路的负载分担和互为备份。 DDM--分布设备管理      DDM是IRF的基本特性之一,也就是说,用户可以将整个IRF Fabric看成一台整体设备进行管理。      用户可以通过CONSOLE、SNMP、TELNET、WEB等多种方式来管理整个IRF Fabric,用户通过任何连接到一个端口、任何一个IP地址来管理整个Fabric,而不需要关心自己具体连接到了那个Unit上(见图2)。 图2 用户将一个Fabric当成一台整体设备进行管理 DRR--分布冗余路由     IRF的一个重要特征是DRR,也就是说,IRF Fabric的多个Unit在外界看来是一台单独的三层交换机。IRF Fabric将作为一个整体设备来执行路由能力和二三层的报文转发,并且完全支持路由协议的热备份技术,在单个Unit发生故障时,转发和路由功能可以完 全不受影响。 IRF在多台设备之间提供了的完全冗余备份,在路由可靠性上达到了一个新的高度。 图3说明了IRF中路由协议的工作情况。 图3 IRF中路由协议的备份和切换示意图 DLA--分布链路聚合     在IRF Fabric中,用户可以将不同Unit的多个端口进行聚合。也就是说,在Fabric的范围内有统一的聚合管理,可以跨越设备地进行聚合和解除聚合。这 不仅可以使得聚合的设定更加方便,同时,跨越设备的链路聚合也有效的避免了单点故障的发生。只要聚合链路所连接的多个Unit、多个端口还有一个在工作, 聚合链路就不会失效。      同时,IRF还支持802.3ad所规定的标准LACP协议,通过LACP协议,可以使链路聚合的设定和管理更加简单。LACP协议在需要聚合的链路上运 行,可以自动发现和解除聚合。 图4对DLA进行了说明。 图4 分布链路聚合示意图 二、IRF的技术优势      支持IRF的设备可以使用户的投资得到更多的价值回报,这主要体现在易管理、易扩充、高可靠几个方面: 多台设备的统一管理    支持IRF技术的多台设备可以被看成是一台统一的设备,这是IRF的最重要特性之一。用户将IRF网络搭建好之后,就不需要再具体关心各个具体的设备。用 户通过任何方式对网络进行管理和设置,无论是Vlan划分、地址设置、聚合设置,都可以跨设备进行,用户始终面对的都是整个IRF Fabric。      IRF相对于传统的单台设备组网,具有很大的管理优势,可以有效的节省管理成本。用户只需要连接上任何一个端口就可以管理整个IRF Fabric内的所有设备,而不再需要去记录各个设备的IP地址。并且IRF内部的多台设备对外界完全是不可见的,用户不需要考虑在它们之间分配IP、连 接互通、运行路由协议。用户只需要将Fabric作为一个整体设备进行地址分配和路由规划,因为需要考虑的设备数目减少了,网络的规划过程、组建过程、维 护过程也都将大大的简化。 只需要一个连接、一个IP地址,整个IRF Fabric尽在掌握之中。 按需购买、平滑扩充     随着网络和计算机的日益应用广泛,大部分企业、学校、团体、社区使用网络规模都不是一成不变的,网络规模会随着组织规模的不断增长而增长。在最初规划网络 的时候,一般都将会预留一定的容量以便于扩充和升级。但是如果预留的容量太大,对于初期紧张的资金将是一种浪费;预留的容量太小,将来升级时不免会捉襟见 肘。这一直是困扰网络规划者的一个难题。 有了IRF,网络的扩容和升级将变得前所未有的简单和快捷。用户在网络建设初期可以只购买当前需要的网络设备,不需要为将来的网络需求预先买单。等到网络 规模需要扩充时,新的设备可以在运行中随时加入,并将自动同步获取IRF的全局配置。在这个扩容中原来设备的运行基本不受影响,用户老的投资可以得到最大 限度的保护,而容量和端口数目却随之得到扩充。 1:N完全备份的高可靠性     随着网络规模的不断发展和应用范围的日益广泛,网络设备的可靠性变得越来越重要,IRF技术的出现将给高可靠性以全新的阐释。      组成IRF的各个设备之间是负载分担和1:N备份的关系。在一台设备出现故障的时候,其它设备可以照常运行并迅速接管故障设备的功能。此时,域内路由协议 不会随之出现中断;通过跨越设备的聚合,通信链路也得到了完善的保护;转发流量和大部分业务都不会出现中断。      华为3Com公司实现的IRF中,多台设备之间可以通过光纤进行互联组成Fabric,设备间的距离最长可以达到70公里。用户可以跨楼宇、跨地区、甚至 跨城市来组建IRF,这时IRF的备份能力将可以有效的防范停电、火灾、自然灾害带来的风险。     相对于传统的设备组网,IRF提供了真正的单播路由协议和组播路由协议的热备份。并且用户并不需要为了备份而专门花费资金,IRF中的所有单元都是活动单 元,IRF中所有的设备都实际参与业务运行,所有单元都行使着二层转发、三层转发、路由、聚合等功能。换句话说,IRF是在提供业务的同时提供热备份。     IRF作为目前以太网交换机领域最新和最尖端的技术,给网络组建带来了全新的感受。支持IRF技术的系列以太网交换机产品的推出,给网络规划者提供了一个 低价格但是高性能的解决方案。有了IRF,网络就可以真正做到按需购买、平滑升级!