华为数据中心网络设备例行维护

例行维护的目的

例行维护是一种预防性的维护。它是是对设备进行的定期检查与保养,及时发现并消除设备存在的缺陷或隐患,确保设备能够长期安全、稳定、可靠地运行,满足业务运行的需求。

例行维护的基本原则

  • 机房环境

机房的运行环境应达到相关国家标准或行业标准的基本要求,保持清洁与干净,并防尘、防潮,防止鼠虫进入。

  • 人员要求

维护人员在上岗前必须接受必要的维护培训,学习必要的设备维护知识、掌握设备的基本操作技能和应急处理技能,并严格遵守操作规程和行业安全规程,确保人身安全与设备安全。

  • 设备维护规范

建立维护制度、周期性检查、口令管理规范、重大操作规范、数据修改规范、防静电规范。

例行维护的分类 - 日常例行维护

日常例行维护是指每天进行的、维护过程相对简单、并可由一般维护人员实施的维护操作,如告警系统检查、设备运行检查等。日常维护的目的包括:

  • 及时发现设备所发出的告警,并采取适当的措施予以恢复和处理,维持设备的健康水平,降低设备的故障率。
  • 及时发现业务运行过程中各链路状态或连接状态的异常现象,并采取适当的措施以恢复和处理,确保业务运行正常。
  • 实时掌握设备和网络的运行状况,了解设备或网络的运行趋势,提高维护人员对突发事件的处理效率。

例行维护的分类 - 定期例行维护

定期维护是指按一定周期进行的、维护过程相对复杂、且多数情况下须由经过专门培训的维护人员实施的维护操作,如定期检查供电系统、定期检查接地系统、定期进行设备除尘等。定期维护的目的是:

  • 通过定期维护和保养设备,使设备的健康水平长期处于良好状态,确保系统能够安全、稳定、可靠运行。
  • 通过定期检查、备份、测试、清洁等手段,及时发现设备在运行过程中所出现的自然老化、功能失效、性能下降等缺陷,并采取适当的措施及时予以处理,以消除隐患、预防事故的发生。

例行维护项目简介

用户在设备的日常运行中,可以结合维护项目的操作指导完成设备的维护管理。同时,也可以根据实际的组网情况和机房环境要求,对以上提供的维护项目和指导进行增加或者删除,以满足实际维护的需要。

系统时间的校准是十分重要的,因为系统的日志系统都是需要按照系统时间来查看的,要是系统时间不准确了,那么日志里面的报错等这些信息就都失去了原来的价值

接口流量可能会出现病毒占用我的接口流量的带宽(异常接口流量状态)

设备运行环境的日常维护建议

  • 设备环境检查

设备运行环境正常是保证设备正常运行的前提。

  • 设备基本信息检查

检查设备的基本信息,如软件版本、补丁信息、系统时间等是否正确。

  • 设备运行检查

检查设备的运行情况,如子卡运行状态、设备复位情况、设备温度等是否正常。

  • 接口内容检查

检查设备的接口信息,如接口协商模式、接口配置、接口状态等是否正确。

  • 业务检查

检查设备运行的业务是否正常。

维护常用方法

  • 指示灯状态分析(最能直接看到的一个状态)

主要用于查看各个单板和用户端设备的运行状态,判断单板或用户端设备是否损坏。

  • 告警日志分析

通过查看网管终端上显示出的当前告警和历史告警信息,判断系统是否正常运行,发生故障后定位故障。故障排除后,当前的告警信息应该消除。

  • 互换方法

主要是用于在不能定位故障时,用好单板、正常的用户线路或用户端设备分别替换到发生故障的槽位、线路或用户端设备,从而定位和判断故障所在。

  • “ping”

对于业务网络和网管网络的故障,通常可以用“ping”各节点IP地址的方法定位故障。

  • 观察法(维护人员到现场第一件做的事情)

主要是指通过告警现象来判断部分故障。观察法是维护人员在遇到故障时最先使用的方法,对观察结果的正确判断是对故障正确分析和正确处理的关键环节。

  • 拔插法

对最初发现某种电路板故障时可以通过拔插一下接口插头的方法,排除因接触不良或处理机异常的故障。

  • 隔离法

当系统部分故障时,可以将与其相关的设备分离或甩开,来判断是否是相互影响造成的故障。

  • 自检法

当系统或电路板重新上电时,通过自检来判断故障。一般的设备在重新上电自检时,其面板上指示灯会呈现出一定的规律地闪烁,因此可以依此判断电路板是否自身存在问题。

  • 按压法

采用按压芯片、电缆接头等方法可以排除因接触不好所产生的故障。

设备环境检查

SX7交换机密码遗忘操作

AAA验证

AAA 通常采用“客户端—服务器”结构。这种结构既具有良好的可扩展性,又便于集中管理用户信息。

认证

     不认证:对用户非常信任,不对其进行合法检查,一般情况下不采用这种方式。

     本地认证:将用户信息配置在网络接入服务器上。本地认证的优点是速度快,可以为运营降 低成本,缺点是存储信息量受设备硬件条件限制。

     远端认证:将用户信息配置在认证服务器上。

授权

AAA 支持以下授权方式:

    不授权:不对用户进行授权处理。

    本地授权:根据网络接入服务器为本地用户账号配置的相关属性进行授权。

计费

AAA 支持以下计费方式:

     不计费:不对用户计费。

     远端计费:支持通过 RADIUS 服务器或 HWTACACS 服务器进行远端计费。

做一个简单的FTP小实验里面会涉及到AAA

以华为S5700I交换机为例,配置登录认证学习笔记一:

(6条消息) 华为S5700交换机登录认证配置学习笔记_changshi4641的博客-CSDN博客

(一)、无需任何密码通过控制端口登录

[switchA]user-interface con 0 

[switchA-ui-console0]authentication-mode none

[switchA-ui-console0]disp this

#

user-interface con 0

 set authentication password simple 123456

此时,尽管交换机设置了console登录密码为123456,但由于console口已被设置为不进行安全的认证的方式,故通过console端口登录交换机时并不需要输入密码。这也是华为S5700出厂时的默认方式。

(二)、使用密码通过控制端口登录

如果我们此时输入以下命令,把console口登录认证方式设置为密码认证方式的话,那么在通过console端口登录交换机时就需要输入密码,也就是我们设置的密码123456。

[switchA-ui-console0]authentication-mode password

[switchA-ui-console0]disp this

#

user-interface con 0

 authentication-mode password

 set authentication password simple 123456

此时,console口的登录均与交换机中的用户无关,即与aaa中的local-user毫无关系。

(三)、使用aaa用户名和密码从控制端口登录

如果我们想配置以aaa中的用户从console端口登录,则需要:

1、设置con的认证模式为aaa

user-interface con 0

 authentication-mode aaa

 set authentication password simple 123456

2、创建aaa用户,并保证该用户拥有terminal的服务类型权限(默认情况下,所有的aaa用户都拥有terminal权限的,除非特别排除,因此如果单纯的只是为了让下面的admin用户拥有可以console的权限,service-type的权限是不用特别设置的)。

aaa

 local-user admin password simple abc@123

 local-user admin service-type telnet terminal ssh

此时从console口登录时需输入用户名:admin 和认证密码:abc@123。因为我们把console的认证模式设置为使用aaa用户的认证方式,故认证过程中的一切要素均来自于aaa用户中的各个属性值,故其认证密码也就与“set authentication password simple 123456”中的密码无关了。

当然,在实际生产过程中我们在设置密码时一般都不会设置存储明文密码字符串,而是会选择对密码串进行加密:"set authentication password cipher 123456”,这样的话当我们在display 时看到的就是加密之后的密码串了。

(四)、配置设备可以telnet登录

1、配置管理Ip

interface vlanif 1

  ip address 172.16.1.254 255.255.255.0

2、开启telnet服务

telnet server enable

3、设置vty 0 4认证方式

   a、方式一:设置telnet为password认证方式,即telnet时无登录用户名,只需输入telnet密码123456就可以了

user-interface vty 0 4

 authentication-mode password

 user privilege level 15      /*设置远程登录后的操作权限级别为最高的15级*/

 set authentication password simple 123456

 protocol inbound all         /*华为默认远程只允许ssh登录,把它改为protocol inbound ssh telnet 或 all就行了。*/

   b、方式二:设置telnet为aaa用户认证方式,即telnet时需输入登录用户名和登录密码,即admin和abc@123,下面的倒数第2、3行的内容与aaa用户认证无关。

#

aaa

 local-user admin password simple abc@123

 local-user admin service-type telnet terminal ssh  /*设置admin用户拥有telnet、terminal和ssh的权限*/

 local-user admin privilege level 15 /*如果此处不设置,默认level=3,其实也是系统管理权限*/

quit

#

user-interface vty 0 4

 authentication-mode aaa

 user privilege level 15      /*设置远程登录后的操作权限级别为最高的15级,此权限对以aaa身份登录的用户无效*/

 set authentication password simple 123456

 protocol inbound all         /*华为默认远程只允许ssh登录,把它改为protocol inbound ssh telnet 或 all就行了。*/

部件更换概述

在下面两种情况下需要更换部件:

设备维护

  • 设备维护包括定期维护与故障处理两类:
  • 例行维护
  • 有些部件需要例行维护(包括每日维护,每周维护,月度维护,季度维护和年度维护),如防尘绵需要定期清洗等。
  • 故障处理
  • 当通过告警或指示灯等设备的维护信息,确定某些部件(如单板或线路)故障导致业务不正常时,需要及时更换。

部件升级

当部件增加新功能时,需要对部件进行升级。为确保单板成功升级,如单板的拆卸、安装及恢复配置等操作都请严格遵循手册所写的流程。

更换部件的流程

确认操作的可行性

在执行故障处理或设备检修的过程中,当维护人员需要对某个设备部件执行更换操作时,首先要对本次操作的可行性进行必要的评估:

设备库房是否有被更换部件的可用备件。

维护人员是否有能力执行本次更换操作。部件更换操作只能由专业的维护人员执行,即维护人员必须熟悉CE交换机各个部件的功能与作用、了解部件更换的基本操作流程、掌握部件更换的基本操作技能。

本次更换操作的风险是否可以控制。部件更换是具有一定风险的维护操作,更换过程中操作不当可能导致设备运行异常、业务中断或人身伤害等事故。维护人员在执行部件更换操作之前,必须全面评估本次操作的风险,即评估在设备不掉电的情况下是否可以通过一定的技术保护措施来控制风险。只有在风险可控的情况下,维护人员方可执行更换操作,否则请及时联系华为公司驻当地办事处,以便能够快速获取华为公司的技术支持。

准备备件与工具

在确认本次更换操作可行的情况下,接下来维护人员应准备被更换部件的备件与必要的工具。

准备好待更换部件的备件。

常用的工具有:万用表、防静电腕带、十字螺丝刀、一字螺丝刀、尖嘴钳、斜口钳、老虎钳等。

实施技术保护措施

部件更换虽然具有一定的操作风险,但在大部分情况下,维护人员可以通过实施一定的技术保护措施来规避这种风险。例如,在更换主备用运行方式的主用单板时,维护人员可先将主用单板的业务倒换到备用单板上,在备用单板完全运行正常以后更换原主用单板,这样就可以避免更换单板给业务运行所带来的风险。

因此,为确保设备的运行安全,并使部件更换操作对系统业务运行的影响降到最低程度,维护人员在执行部件更换操作之前,必须预先做好相应的技术保护措施。

执行部件更换操作

在确认相应的技术保护措施已经到位的情况下,维护人员即可按照本手册的相关操作规程执行部件更换操作,例如拔出单板、插入单板等。

验证新部件的功能

当维护人员完成部件的更换操作以后,还需要参考本手册提供的相关检查或测试方法验证新部件的功能。只有在确认新部件的功能完全正常的情况下,本次更换操作才是成功的,否则,维护人员应及时联系华为公司驻当地办事处,以便能够快速获取华为公司的技术支持。

返修有故障的部件

对于更换下来并确认有故障的部件,维护人员应及时填写《故障返修件传送单客户联》,然后将该此卡连同故障部件一起打包并邮寄给华为公司,以便华为公司能够尽快响应并处理维修需求。

更换单板通用方法

操作步骤

佩戴防静电腕带,并将其插头一端插入ESD插孔,或者佩戴防静电手套。

选取备件。选择单板类型与待更换单板完全相同的备板。如不一致,需要确认单板之间能否替代。检查并确认无部件损坏和元器件脱落现象,并记录单板拉手条面板上的条形码信息。

记录线缆的位置,并查看各线缆上的标签是否正确、清晰和整洁。如果标签不易识别则需重新制作并粘贴标签,避免连接线缆时出错。

拆下待更换单板上的线缆。

拔出待更换单板。

  • 用螺丝刀拧开单板两端的松不脱螺钉,如左图中(1)所示。
  • 将拉手条两侧扳手外翻,使单板和背板分离,如左图中(2)所示。
  • 握住扳手沿着插槽导轨平稳拉出单板,如左图中(3)所示。
  • 注意: 拔出单板的过程中,当单板拔离背板连接器后,仍需要沿导轨方向缓慢抽离机框,以免接触到其他单板上的部件,造成部件损坏。
  • 说明: 更换单板硬件操作过程基本类似,这里的图形以更换业务板举例说明。

  • 插入新单板。
    • 将新单板的拉手条两侧扳手外翻,沿着插槽导轨平稳滑动插入,如右图中(1)所示。
    • 当新单板的扳手与机框接触时,将扳手内翻,直到扳手与拉手条面板平行,凭借扳手与机框之间的作用力将新单板推入机框,如右图中(2)所示。
    • 用螺丝刀拧紧单板两端的松不脱螺钉,如右图中(3)所示。
  • 按照记录的顺序插上新单板上的光模块或线缆。
  • 观察新插入单板的“RUN/ALM”指示灯状态。
  • 说明: 单板从启动到正常运行需要一段时间(少于7min)。
    • “RUN/ALM”指示灯为绿色且快速闪烁(4Hz,每秒闪烁4次),表示单板启动加载中。
    • “RUN/ALM”指示灯为绿色且慢速闪烁(0.5Hz,每2秒闪烁1次),表示单板已经正常运行。
  • 更换单板注意事项
  • 通用注意事项
    • 单板的放置与搬运:
      • 单板放置于机框(机箱)外时,注意轻拿轻放及ESD防护。单板要水平放置,将器件不易撞坏的一面朝下,同时要确保水平面无其他异物。
      • 禁止放置在潮湿或阳光直晒的地方,确保单板暂时存放区域的周围环境不会对单板造成损害。
      • 搬运多块单板时,若只有静电防护袋,无其他保护措施,禁止将单板叠放在一起进行搬运,确保每次只对一块单板进行操作。
  • 插拔操作:
    • 更换前需做好防静电准备,禁止触摸电路板(PCB)表面。
    • 插拔单板时,确保无线缆与单板连接。如果有线缆与单板连接,请先在线缆上粘贴标签,记录线缆与端口的对应关系。如果待插拔的线缆是光纤,请勿裸眼靠近或直视光口或接头,以免激光灼伤眼睛。

窍门: 待更换单板接口上的光模块不要立即拔下来。先在光模块的接口上塞好防尘帽,待新单板安装好后,再将光模块拔下插到新单板对应的接口上。

  • 操作过程中,要对准导轨缓慢、平稳地插拔,还要避免金属物体造成短路、操作工具放置不当等。
  • 请按照更换前的顺序将光模块、电缆等依次插到新单板的接口上。

其他注意事项及操作建议

业务板:拆卸正在加载程序的业务板会造成业务板程序损坏,更换前请确认业务板不在加载程序。正在加载程序的单板,RUN/ALM指示灯绿色快闪(4Hz,每秒闪4次)。

 主控板:如果系统可以进行软件CLI操作,现场实施更换前先保存数据。

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值