EFM简介
以太网技术简单易用、价格低廉、且带宽可不断提高,无论是作为一种业务还是作为一种网络结构,其在企业网范围内都已经得到广泛应用。随着以太网推广的范围逐渐扩大,对以太网管理和维护功能的需求也越来越强烈。但是传统以太网可维护、可运营能力比较弱,最后一公里以太网EFM(Ethernet in the First Mile)的出现很好的解决了这一问题。
根据网络的分层/分级架构,需要提供分层/分级的以太OAM功能。 如图1所示。
EFM主要用于接入部分的以太网物理层规范以及以太网管理和维护,是链路级的OAM(Operation and Management)。针对两台直连设备之间的链路,提供链路连通性检测功能、链路故障监控功能、远端故障通知功能和远端环回功能。
EFM基本概念
OAM协议数据单元OAMPDU
EFM工作在数据链路层,其协议报文被称为OAMPDU(OAM Protocol Data Units)。EFM通过设备之间定时交互OAMPDU来报告链路状态,使网络管理员能够对网络进行有效的管理。图2为OAMPDU的格式及其几种常见的OAMPDU。各参数含义如表1所示。
字段 | 含义 |
---|---|
Destination addr | 目的MAC地址,为慢速协议组播地址:0x0180-C200-0002。慢速协议报文的特点是不能被网桥转发,因此无论是否具备OAM功能或OAM功能是否激活,EFM OAMPDU都不能跨多跳转发。 |
Source addr | 源MAC地址,为发送端的端口MAC地址(若没有则采用该设备的桥MAC地址),是一个单播MAC地址。 |
Type | 取值为0x8809,用于标识慢协议类型。 |
Subtype | 用于标识慢协议的子协议类型,此处取值为0x03,用于标识EFM协议。 |
Flags | EFM实体的状态信息。
|
Code | 消息编码,不同取值表示不同类型的OAMPDU。
常见的OAMPDU类型如表2所示。 |
OAMPDU类型 | 说明 |
---|---|
信息OAMPDU(Information OAMPDU) |
|
事件通告OAMPDU(Event Notification OAMPDU) | 用于链路监控,当接口检测到误帧越限事件、误码越限事件或误帧秒越限事件时,该接口通过向对端设备发送事件通告OAMPDU来通告故障。 |
远端环回OAMPDU(Loopback Control OAMPDU) | 用于远端环回,控制远端设备的OAM环回状态,根据OAMPDU中使能和去使能环回功能的信息开启或关闭远端环回功能。 |
连接模式
EFM的连接模式有两种:主动模式和被动模式。EFM连接只能由主动模式的OAM实体发起,而被动模式的OAM实体只能等待对端OAM实体的连接请求。不同的连接模式对OAMPDU的处理能力是不一样的。如表3所示。
OAMPDU的处理能力 | 主动模式 | 被动模式 |
---|---|---|
初始化Discovery过程支持(发起连接请求,即第一次发送Information OAMPDU) | 支持 | 不支持 |
响应Discovery初始化过程(响应连接请求) | 支持 | 支持 |
发送Information OAMPDU | 支持 | 支持 |
发送Event Notification OAMPDU | 支持 | 支持 |
发送Loopback Control OAMPDU | 支持 | 不支持 |
响应Loopback Control OAMPDU | 支持(要求对端为主动模式) | 支持 |
EFM工作机制
EFM功能包括EFM对端发现、链路监控、故障通告和远端环回。下面以图1为例,介绍EFM实现的基本过程。CE为客户机房设备,PE1为运营商设备,通过在CE和PE1之间部署EFM,可以远程检测CE和PE1之间链路的连通性及其链路质量。
EFM对端发现
EFM连接的建立过程也称为Discovery阶段,即本端OAM实体发现远端OAM实体、并与之建立稳定对话的过程。其实现过程如图4所示。
都处于被动模式下的两个OAM实体之间无法建立EFM连接。
EFM连接建立后,两端的OAM实体会以一定的时间间隔为周期发送Information OAMPDU来检测连接是否正常,该间隔被称为握手报文发送间隔。如果一端OAM实体在连接超时时间内未收到对端OAM实体发来的Information OAMPDU,则认为OAM连接中断,并发送告警到网管。EFM连接建立后为用户提供了一种自动检测物理链路连通状况的手段。
链路监控
在网络物理通信没有中断而网络性能缓慢下降的情况下,以太网链路的故障检测非常困难。链路监控用于在各种环境下检测和发现链路层故障。EFM实体通过交互事件通告OAMPDU来监控链路。
当一端EFM实体监控到如表1所示的一般链路事件时,将向对端发送含有误码越限、误帧越限或者误帧秒越限标记的事件通告OAMPDU进行通报,同时在本地生成告警上报网管,便于网络管理员实时的监控网络的状况,实现对网络的有效管理。
一般链路事件类型 | 说明 | 应用场景 |
---|---|---|
误码越限事件(Errored Symbol Period Event) | 如果在指定周期内,接口检测到的误码数量达到或者超过指定阈值,那么设备将产生误码越限事件,并通告对端设备,同时发送告警到网管。 | 当需要检测物理层数据传输过程中的错误码时可以使用该功能。 |
误帧越限事件(Errored Frame Event) | 如果在指定周期内,接口检测到的误帧数量达到或者超过指定阈值,那么设备将产生误帧越限事件,并通告对端设备,同时发送告警到网管。 | 当需要检测数据链路层数据传输过程中的错误帧时可以使用该功能。 |
误帧秒越限事件(Errored Frame Seconds Summary Event) | 如果在某一秒内发生了错误帧,则将该秒称为错误帧秒。如果在指定周期内,接口检测到的错误帧数量达到或者超过指定阈值,那么设备将产生误帧秒越限事件,并通告对端设备,同时发送告警到网管。 | 当需要检测数据链路层数据传输过程中的错误帧时可以使用该功能。 |
故障通告
EFM邻居发现后,两端EFM实体会不断交互信息OAMPDU,以检测链路的连通性。当设备故障或者不可用导致流量中断时,发生故障的远端OAM实体会发送含有如表2所示的紧急链路事件标记的OAMPDU,将故障信息通知给本端OAM实体,本端OAM实体接收到后发送告警到网管。这样,管理员可以根据告警动态的了解链路状态,对相应的错误作出及时的处理。
紧急链路事件类型 | 说明 |
---|---|
链路故障(Link fault) | 远端OAM实体信号丢失(物理链路故障),向网管发送告警。 |
致命故障(Dying gasp) | 不可预知的状态或者事件发生,如远端设备重启或者远端设备单板重启,向网管发送告警。 |
紧急事件(Critical event) | 不能确定的紧急事件发生,如远端EFM实体和其他特性(BFD和CFM特性)联动,向网管发送告警。 |
链路丢失 (Link loss) | 远端OAM实体信号丢失(协议报文超时),向网管发送告警。 |