目录
1、设备环境检查
设备运行环境正常是保证设备正常运行的前提。
检查项 | 评估标准和说明 | 检查结果 | |
1 | 设备位置摆放是否合理、牢固 | 设备应放在通风、干燥的环境中,且放置位置牢固、平整。设备周围不得有杂物堆积。 | □合格 □不合格 □不涉及 |
2 | 机房温度状况 | 机房温度:0℃~40℃。 | □合格 □不合格 □不涉及 |
3 | 机房湿度状况 | 机房湿度:5%RH~90%RH。 | □合格 □不合格 □不涉及 |
4 | 机房内空调运行是否正常 | 空调可持续稳定运行,使机房的温度和湿度保持在设备规定范围内。 | □合格 □不合格 □不涉及 |
5 | 清洁状况 | 注意防尘网的清洁状况,及时清洗或更换,以免影响机柜门及风扇框的通风、散热。 设备本身应无明显灰尘附着。 | □合格 □不合格 □不涉及 |
6 | 接地方式及接地电阻是否符合要求 | 一般要求机房的工作接地、保护接地、建筑防雷接地分开设置,因机房条件限制,可采用联合接地。 设备的接地线连接至接地排的接线柱上时,接地电阻应小于5Ω。 设备的接地线连接至接地体上时,接地电阻应小于10Ω。 当环境不具备接地条件时,可将设备的接地线相连,保持几台设备的带电压差一致。 | □合格 □不合格 □不涉及 |
7 | 电源连接是否正常可靠 | 电源线应正确的连接到设备的指定位置上,且连接牢固。设备的电源指示灯应常亮绿色。 | □合格 □不合格 □不涉及 |
8 | 供电系统是否正常 | 要求供电系统运行稳定。直流额定电压范围为–48V DC~–60V DC。交流额定电压范围为100V AC~240V AC。 | □合格 □不合格 □不涉及 |
2、设备基本信息检查
检查设备的基本信息,如软件版本、补丁信息、系统时间等是否正确。下述检查方法中涉及的命令如无特殊说明,均可在所有视图下执行。
检查项 | 检查方法 | 评估标准 | 检查结果 | |
1 | 设备运行的版本 | 执行display version命令 | 单板PCB版本号、软件版本号与要求相符。 | □合格 □不合格 □不涉及 |
2 | 检查软件包 | 执行display startup命令 | 检查下述系统文件名是否正确: 当前启动大包名 下次启动大包名 备份大包名 配置、许可文件、补丁、语音的当前启动文件名和下次启动文件名 | □合格 □不合格 □不涉及 |
3 | License信息 | 执行display license命令 执行display license state命令 | 查看GTL License文件名、版本及配置项是否符合要求,确认是否需要升级。 “Master board license state”项为“Normal”。“Master board license state”项为“Demo”或“Trial”时,确认License在有效期内。 | □合格 □不合格 □不涉及 |
4 | 检查补丁信息 | 执行display patch-information命令 | 补丁文件必须与实际要求一致,建议加载华为公司发布的该产品版本对应的最新的补丁文件。 补丁必须已经生效,即补丁的总数量和正在运行的补丁数量一致。 | □合格 □不合格 □不涉及 |
5 | 检查系统时间 | 执行display clock命令 | 时间应与当地实际时间一致(时间差不大于5分钟),便于故障时通过时间精确定位。 如果不合格,请在用户视图下执行clock datetime命令修改系统时间。 | □合格 □不合格 □不涉及 |
6 | 检查Flash空间 | 在用户视图下执行dir flash:命令 | Flash里的文件都必须是有用的,否则请在用户视图下执行delete /unreserved命令删除。 | □合格 □不合格 □不涉及 |
7 | 检查SD卡空间 | 在用户视图下执行dir sd0:命令或dir sd1: 命令 | SD卡里的文件都必须是有用的,否则请在用户视图下执行delete /unreserved命令删除。 | □合格 □不合格 □不涉及 |
8 | 信息中心 | 执行display info-center命令 | “Information Center”项为“enabled”。 | □合格 □不合格 □不涉及 |
9 | 检查配置正确性 | 执行display current-configuration命令 | 通过查看当前生效的配置参数,验证设备配置是否正确。 | □合格 □不合格 □不涉及 |
10 | 检查debug开关 | 执行display debugging命令 | 设备正常运行时debug开关应该全部关闭。 | □合格 □不合格 □不涉及 |
11 | 检查配置是否保存 | 在用户视图下执行compare configuration命令 | 当前的配置和下次启动的配置文件内容一致。 | □合格 □不合格 □不涉及 |
3、运行检查
检查设备的运行情况,如单板运行状态、设备复位情况、设备温度等是否正常。下述检查方法中涉及的命令如无特殊说明,均可在所有视图下执行。
检查项 | 检查方法 | 评估标准 | 检查结果 | |
1 | 单板运行状态 | 执行display device命令 | 重点关注单板在位信息及状态信息是否正常。 单板“Online”为“Present”。 单板“Power”为“PowerOn”。 单板“Register”为“Registered”。 单板“Alarm”为“Normal”。 | □合格 □不合格 □不涉及 |
2 | 设备复位情况 | 诊断视图下执行display reset-reason命令 | 通过查看复位信息(包括复位时间、复位原因),确认无非正常复位。 | □合格 □不合格 □不涉及 |
3 | 设备温度 | 执行display temperature all命令 | 各模块当前的温度应该在上下限之间,即“Temperature”的值在“Upper”和“Lower”之间。 | □合格 □不合格 □不涉及 |
4 | 风扇状态 | 执行display fan命令 | Present项为YES表示正常。 | □合格 □不合格 □不涉及 |
5 | 电源状态 | 执行display power命令 | State项为Supply表示正常。 | □合格 □不合格 □不涉及 |
6 | FTP网络服务端口 | 执行display ftp-server命令 | 不使用的FTP网络服务端口要关闭。 | □合格 □不合格 □不涉及 |
7 | 告警信息 | 执行display alarm active命令 | 无告警信息。 如果有告警,需要记录,对于严重以上告警需并立即分析并处理。 | □合格 □不合格 □不涉及 |
8 | CPU状态 | 执行display cpu-usage命令 | 各模块的CPU占用率正常。如果CPU占用率如果超过80%,建议重点关注。 | □合格 □不合格 □不涉及 |
9 | 内存占用率 | 执行display memory-usage命令 | 内存占用情况正常,如果“Memory Using Percentage Is”超过60%时需要关注。 | □合格 □不合格 □不涉及 |
10 | 日志信息 | 执行display logbuffer命令 执行display trapbuffer命令 | 不存在异常信息。 | □合格 □不合格 □不涉及 |
4、接口内容检查
检查设备的接口信息,如接口协商模式、接口配置、接口状态等是否正确。下述检查方法中涉及的命令如无特殊说明,均可在所有视图下执行。
检查项 | 检查方法 | 评估标准 | 检查结果 | |
1 | 接口错包 | 执行display interface命令 | 业务运行时,要检查接口有无错包,包括CRC错包等。 | □合格 □不合格 □不涉及 |
2 | 接口配置 | 执行display interface命令 | 接口的配置项合理,如接口双工模式、协商模式、速率、环回配置等。 | □合格 □不合格 □不涉及 |
3 | 接口状态 | 执行display interface brief命令 | 接口的Up/Down状态满足规划要求。 | □合格 □不合格 □不涉及 |
4 | PoE供电 说明: 仅**型号支持 | 执行display poe power-state interface interface-type interface-number命令 | PoE供电状态正常,“Port power ON/OFF”为“ON”的接口,其“Port power status”为“Delivering-power”。 | □合格 □不合格 □不涉及 |
5、业务检查
检查设备运行的业务是否正常。下述检查方法中涉及的命令如无特殊说明,均可在所有视图下执行。以下只是举例,大家可以自行添加需要检查的业务。
检查方法 | 评估标准 | 检查结果 | ||
组播 | 成员接口和路由器接口信息 | 执行display igmp-snooping port-info命令 | 静态成员接口、动态成员接口、静态路由器接口和动态路由器接口的信息正确。 | □合格 □不合格 □不涉及 |
报文统计信息 | 执行display igmp-snooping statistics vlan命令 | VLAN发送的IGMP报文个数,接收的IGMP报文和PIM Hello报文个数,以及所有VLAN内发生的二层事件次数统计合理。 | □合格 □不合格 □不涉及 | |
转发表信息 | 执行display l2-multicast forwarding-table vlan vlan-id命令查看二层组播转发表项 执行display multicast forwarding-table命令查看三层组播转发表项 | 组播转发表项正确。 | □合格 □不合格 □不涉及 | |
组播路由协议 | 执行display multicast routing-table命令 | 域内组播路由协议采用PIM-SM。 与组播相连的接口都必须要使能IGMP。 | □合格 □不合格 □不涉及 | |
IP业务 | IP流量统计信息 | 执行display ip statistics命令,分两次间隔5秒钟后收集数据并比较。 | 单次采集的错包和TTL超时报文数小于100。 正常情况下,两次采集的错包数和TTL超时报文数没有增长。 | □合格 □不合格 □不涉及 |
ICMP流量统计信息 | 执行display icmp statistics命令 | “destination unreachable”和“redirects”项不超过100。 | □合格 □不合格 □不涉及 | |
IP地址池信息 | 执行display ip pool命令 | “Conflict”项为0。 | □合格 □不合格 □不涉及 | |
NAT ALG的使能情况 | 执行display nat alg命令 | 确认“dns”、“ftp”、“rtsp”、“sip”项的使能状态“status”是否符合自身业务需求。 | □合格 □不合格 □不涉及 | |
NAT Server配置信息 | 执行display nat server命令 | 公网地址和服务端口号Global IP/Port、私有地址和服务端口号Inside IP/Port配置正确,符合自身业务需求。 | □合格 □不合格 □不涉及 | |
NAT流表信息 | 执行display nat session all verbose命令 | 确认NAT转换后的“New SrcAddr”、“New SrcPort”、“New DestAddr”和“New DestPort”项符合自身业务需求。 | □合格 □不合格 □不涉及 | |
广域网 | PPP协议状态 | 执行display interface serial命令 | “current state”项为“UP”时,“Line protocol current state”项需为“UP”。 | □合格 □不合格 □不涉及 |
FR协议状态 | 执行display interface mfr命令 | “current state”项为“UP”时,“Line protocol current state”项需为“UP”。 | □合格 □不合格 □不涉及 | |
3G | 呼叫连接信息 | 执行display cellular interface number all命令 | “Current Service Status”项为“Service available”。 “Packet Session Status”项为“Active”。 | □合格 □不合格 □不涉及 |
可靠性 | 备份接口状态 | 执行display interface brief命令 | 备份接口的物理状态为“^down”。 | □合格 □不合格 □不涉及 |
VRRP状态 | 执行display vrrp命令 执行display vrrp statistics命令 | “State”不为“Initialize”状态。 备份组中的设备的VRRP状态“State”不能同时为“Master”。 “Checksum errors”、“Version errors”和“Vrid errors”为零。 | □合格 □不合格 □不涉及 | |
BFD Session状态 | 执行display bfd session all verbose命令 执行display bfd statistics命令 | 所有BFD Session的状态为Up。 | □合格 □不合格 □不涉及 | |
MSTP | MSTP状态 | 执行display stp brief命令 | 指定端口和根端口的“STP State”为“FORWARDING”。 备份根端口的“STP State”为“DISCARDING”。 | □合格 □不合格 □不涉及 |
MST域配置信息 | 执行display stp region-configuration命令 | 域名、域的修订级别、VLAN与生成树实例的映射关系以及配置的摘要符合要求。 | □合格 □不合格 □不涉及 | |
MSTP拓扑变化 | 执行display stp topology-change命令 | 查看MSTP拓扑变化相关的统计信息。 如果设备拓扑变化次数递增,则可以确定网络存在震荡。 | □合格 □不合格 □不涉及 | |
TC/TCN报文收发计数 | 执行display stp tc-bpdu statistics命令 ,分两次隔5分钟后采集收发报文数据并比较。 | 正常情况下,两次数据应该无增长或增长很少,表示实例端口状态稳定。 | □合格 □不合格 □不涉及 | |
路由信息 | 路由表信息 | 执行display ip routing-table命令 | 具有默认路由或者其他精确路由,便于故障时候可以远程定位。 对于处于一个网络中同一层次的设备,如果运行相同的路由协议,各设备上的路由条目应该相差不大(因为静态路由的配置差异,路由条目上可能存在一定差异)。 | □合格 □不合格 □不涉及 |
OSPF错包情况 | 执行display ospf error命令。分两次隔5分钟后收集数据,然后比较。 | 正常情况下,两次的数据没有增长。 | □合格 □不合格 □不涉及 | |
OSPF邻居状态 IS-IS邻居状态 BGP邻居状态 | 执行display ospf peer命令 执行display ospf peer last-nbr-down命令 执行display isis peer命令 执行display bgp peer命令 | OSPF邻居状态: 邻居状态“State”为“Full”。 正常情况下,没有邻居down掉。 IS-IS邻居状态: 邻居状态“State”为“Up”。 BGP邻居状态: 邻居状态“State”为“Established”。 | □合格 □不合格 □不涉及 | |
OSPF Router ID | 执行display current-configuration configuration ospf命令 | 指定Router ID为Loopback口地址。 如未分配Loopback口地址,则要指定为上行口地址或其他Down掉概率最小接口的地址。 | □合格 □不合格 □不涉及 | |
OSPF路由引入配置 | 执行display current-configuration configuration ospf命令 | 尽量使用Network方式发布路由,也可以通过import方式引入路由。 | □合格 □不合格 □不涉及 | |
OSPF虚连接 | 执行display ospf vlink命令 | 邻居状态“State”为“Full”。 | □合格 □不合格 □不涉及 | |
OSPF STUB区域 | 执行display current-configuration configuration ospf命令 | STUB区域,不能使用Import方式引入路由。 | □合格 □不合格 □不涉及 | |
BGP路由发布 | 执行display current-configuration configuration bgp命令 | 不建议采用import-route protocol命令发布IP路由。 应使用network { ipv4-address | ipv6-address prefix-length命令和ip route-static ip-address { mask | mask-length } null0命令手工聚合路由后再静态发布。 | □合格 □不合格 □不涉及 | |
IBGP邻居 | 执行display current-configuration configuration bgp命令 | 基于协议稳定性的考虑,建议使用Loopback这类状态总为UP的接口建立邻居关系。 | □合格 □不合格 □不涉及 | |
L3VPN | VPN路由信息 | 执行display ip routing-table vpn-instance vpn-instance-name命令 | 确认路由表项中有去往对端CE的路由。 | □合格 □不合格 □不涉及 |
VPN实例发出/收到的路由属性 | 执行display ip vpn-instance verbose命令 | Export VPN Targets和Import VPN Targets配置正确。 | □合格 □不合格 □不涉及 | |
WLAN | AP信息 | 执行display ap命令 | “State”项为“Normal”。 | □合格 □不合格 □不涉及 |
原文地址:华为交换机路由器例行维护(巡检)方法参考