一 网络割接流程

1.1 设备割接的原因:

设备老旧,导致设备性能不能满足当前业务需求等

1.2 设备割接的目的:

网络项目的过程_链路

替换/扩容/改造/变更 新设备满足当前业务需求

1.3 信息收集

网络项目的过程_文件名_02

1 查看设备中的一些命令进行收集

2 对割接的现场进行查看 设备的型号 端口 对有些重要的业务信息打上标签

3 对割接的现场进行脚本收集

4 根据现场的环境在ENSP 中构建括谱图,这样做到心中有数

5 确认收集到信息后 跟现场的主管商割接的流程

1.4 翻译脚本

  1. 1 下载软件 补丁文件  系统文件 授权文件
  2. 2 在ENSP 中模拟割接项目中的业务环境,重点分析流量的走向
  3. 3 分析自己保存的脚本 查看是否有风险
  4. 4 对于自己收集到脚本形成表格 比如 插线表,ENSP括谱图,端口的状态,路由的信息,互联信息,割接的步骤表的流程

网络项目的过程_链路_03

1.5 实施过程

网络项目的过程_链路_04

1.5.1 割接实施过程前期准备

网络项目的过程_文件名_05

 割接开始前对所有的设备进行脚本的收集 防止设备的脚本信息有改变

1.5.2 割接实施过程中期的准备
  1.  保存割接前设备的所有配置信息
  2.  收集arp 信息 方便日后的业务测试
  3.  根据割接方案中的步骤进行操作
  4.  割接完成后对所有的设备上架,对业务进行处理
  5.  收集割接后项目中的所有的项目配置信息
1.5.3 割接实施过程后期的准备

网络项目的过程_网线_06

 验收环节

 整个项目割接流程完毕

网络项目的过程_网线_07

 对本次操作的所有的项目的配置文件,括谱图,管理地址,设备序列号,资料交接,客户培训

二 网络运维工作内容

网络项目的过程_文件名_08

巡检的工作内容:

一 对机房内的环境进行查看 (机房的系统,网络的布线,光纤道布线)

检查项

方法/工具

评估标准和说明

设备摆放位置

观察

设备应放在通风、干燥的环境中,且放置位置牢固、平整。设备周围不得有杂物堆积。

机房温度状况

观察/温度计

通常要求机房长期工作环境温度:0℃~45℃;短期工作环境温度:-5℃~55℃。

机房湿度状况

观察/湿度计

通常机房的长期工作环境相对湿度应在5%RH~85%RH之间,不结露;短期工作环境相对湿度应在0%RH~95%RH之间,不结露。

机房内空调运行是否正常

观察/空调

空调可持续稳定运行,使机房的温度和湿度保持在设备规定范围内。

清洁状况

观察

所有项目都应干净整洁无明显尘土附着。注意防尘网的清洁状况,及时清洗或更换,以免影响机柜门及风扇框的通风、散热。

散热情况

观察

设备正常工作时,要求保持风扇正常运转(清理风扇期间除外),擅自关闭风扇会引起设备温度升高,并可能损坏单板。不要在设备子架上通风口处放置杂物,还应定期清理风扇的防尘网。

线缆布放

观察

电源线与业务线缆分开布放。电源线布放整齐、有序。业务线缆布放整齐、有序。
线缆标签清晰、准确,符合规范。

接地方式及接地电阻是否符合要求

观察

一般要求机房的工作地、保护地、建筑防雷地分开设置,因机房条件限制,可采用联合接地。尤其对于户外使用的设备,设备接地非常重要,如果未接地容易造成雷击损坏。

供电系统是否正常

观察/电压表

要求供电系统运行稳定。直流额定电压范围为–48V DC~–60V。交流额定电压范围为100V~240V。

对机房设备环境检查

  1. 1>机房内空调运行是否正常
  2. 2>电源连接是否正常可靠
  3. 3>机房温度和湿度状况
  4. 4>设备位置摆放是否合理、牢固
  5. 5>接地方式及接地电阻是否符合要求
  6. 6>供电系统是否正常
  7. 7>对防火墙的设备存在安全风险的检查

对机房内的所有设备进行查看

(查看设备重点基本信息,查看设备的状态信息,对设备的信息查看)

2.1 设备基本信息检查

检查项

检查方法

评估标准

设备运行的版本

display version

单板PCB版本号、软件版本号与要求相符。

检查软件包

display startup

检查下述系统文件名是否正确:当前启动大包名;下次启动大包名;备份大包名;配置、许可文件、补丁、当前启动文件名和下次启动文件名。

License信息

display licensedisplay license state

查看GTL License文件名、版本及配置项是否符合要求,确认是否需要升级。“Master board license state”项为“Normal”。“Master board license state”项为“Demo”或“Trial”时,确认License在有效期内。

检查补丁信息

display patch-information

补丁文件必须与实际要求一致,建议加载华为公司发布的该产品版本对应的最新的补丁文件。补丁必须已经生效,即补丁的总数量和正在运行的补丁数量一致。

检查系统时间

display clock

系统时间需要与网络管理服务器的时间保持一致(误差不超过5分钟)。

检查Flash/SD卡/CF卡空间

dir flash、dirslave#cfcard

Flash/SD卡/CF卡里的文件都必须是有用的,否则请在用户视图下执行delete/unreserved命令删除。

信息中心

display info-center

“Information Center”项为“enabled”。

检查配置正确性

display current-configuration

通过查看当前生效的配置参数,验证设备配置是否正确。

检查debug开关

display debugging

设备正常运行时debug开关应该全部关闭。

检查配置是否保存

compare configuration

当前的配置和下次启动的配置文件内容一致。

  • <HUAWEI>display version   //设备运行的版本
  • <HUAWEI> display startup  //检查软件包
  • <HUAWEI>display patch-information  //检查补丁信息
  • <HUAWEI> display clock          //检查系统时间
  • <HUAWEI> dir flash:            //检查Flash空间
  • <HUAWEI>display current-configuration   //检查配置正确性
  • <HUAWEI> display debugging          //检查debug开关
  • <HUAWEI> compare configuration  //检查配置是否保存

2.2 设备的运行检查

检查项

检查方法

评估标准

单板运行状态

display device

重点关注单板在位信息及状态信息是否正常。单板“Online”为“Present”;单板“Power”为“PowerOn”;单板“Register”为“Registered”;单板“Alarm”为“Normal”。

设备复位情况

display reset-reason、display reboot-info

通过查看复位信息(包括复位时间、复位原因),确认无非正常复位。

设备温度

display temperature、display environment

各模块当前的温度应该在上下限之间。

风扇状态

display fan

Present项为YES表示正常。

电源状态

display power

State项为Supply表示正常。

FTP网络服务端口

display ftp-server

不使用的FTP网络服务端口要关闭。

告警信息

display alarm all

无告警信息。如果有告警,需要记录,对于严重以上告警需并立即分析并处理。

CPU状态

display cpu-usage

各模块的CPU占用率正常。如果CPU占用率如果超过80%,建议重点关注。

内存占用率

display memory-usage

内存占用情况正常,如果“Memory Using Percentage Is”超过60%时需要关注。

日志信息

display logbuffer、display trapbuffer

不存在异常信息。

主用板/备用板的备份状态

display switchover state

主备板同时存在时,要同时有主备板的显示状态信息。倒换完成,设备开始正常工作后,主用板需要显示为“realtime or routine backup”表示正常。

  • <HUAWEI> display device  //子卡运行状态
  • <HUAWEI> display reboot-info   //设备复位情况
  • <HUAWEI> display temperature   //设备温度
  • <HUAWEI> display alarm urgent   //告警信息
  • <HUAWEI> display cpu-usage    //CPU状态
  • <HUAWEI> display memory-usage   //内存占用率
  • <HUAWEI> display logbuffer        //日志信息  
  • <HUAWEI> display trapbuffer     //日志信息

2.3 端口的内容检查

检查项

检查方法

评估标准

接口错包

display interface

业务运行时,要检查接口有无错包,包括CRC错包等。

接口协商模式

display interface

接口协商模式正确,两边接口要一致,不能有半双工模式。

接口配置

display current-configuration interface

接口的配置项合理,如接口双工模式、协商模式、速率、环回配置等。

接口状态

display interface brief

接口的Up/Down状态满足规划要求。接口的收发流量是否过大?(长期超过70%)

PoE供电

display poe power-state interface interface-type interface-number

PoE供电状态正常,“Port power ON/OFF”为“ON”的接口,其“Port power status”为“Delivering-power”。

...

  • <HUAWEI> display interface   //  检查端口错包
  • <HUAWEI> display interface   //  端口协商模式
  • <HUAWEI> display current-configuration interface   //  端口配置
  • <HUAWEI> display interface brief  // 端口状态
  • <HUAWEI> display poe power-state interface   //POE供电  

2.4 运行业务的检查

检查项

检查方法

评估标准

MAC地址表信息

display mac-address

MAC地址表信息正确

VLAN信息

display vlan

查看所有VLAN的基本信息

路由表信息

display ip routing-table

具有默认路由或者其他精确路由,便于故障时候可以远程定位 对于处于一个网络中同一层次的设备,如果运行相同的路由协议,各设备上的路由条目应该相差不大(因为静态路由的配置差异,路由条目上可能存在一定差异)

OSPF邻居状态IS-IS邻居状态BGP邻居状态

display ospfpeerdisplay isispeerdisplay bgppeer

OSPF邻居状态:邻居状态“State”为“Full”或者”2-Way”IS-IS邻居状态:邻居状态“State”为“Up”BGP邻居状态:邻居状态“State”为“Established”

VRRP状态

display vrrpdisplay vrrpstatistics

备份组中的设备的VRRP状态“State”不能同时为“Master”

MSTP状态

display stpbrief

指定端口和根端口的“STP State”为“FORWARDING”

  • <HUAWEI> display igmp-snooping port-info   //组播成员接口和路由器接口信息
  • <HUAWEI> display igmp-snooping statistics vlan   //组播报文统计信息
  • <HUAWEI> display dhcp snooping user-bind all  //DHCP Snooping绑定表
  • <HUAWEI> display mac-address  //MAC地址表信息
  • <HUAWEI> display ip routing-table   //路由表信息

2.5 故障信息查看命令

  • display diagnostic-information   //基本信息  
  • display device        //设备信息
  • display interface    //接口信息  
  • display version   //版本信息  
  • display patch-information   //补丁信息  
  • display elabel  //电子标签信息
  • display current-configuration   系统当前配置信息
  • display saved-configuration   系统保存的配置信息
  • display clock    时间信息
  • display trapbuffer   告警信息
  • display logbuffer    用户日志信息
  • display memory-usage   内存使用信息
  • display cpu-usage   CPU使用情况

运维工作内容

1 对设备进行运维巡检(对机房的环境查看系统,网线,光纤,防火墙的设备是否存在安全风险)

2 对一些基本设备的割接处理 (比如 防火墙,交换机,路有器)

3 对机房的设备进行一些系统上的维护(比如 设备升级 去设备官网找对应型号设备的补丁文件)

4 对在运行的项目中的故障进行处理 (比如 OSI 七层架构追层排错  抓包分析)

5 对员工电脑的系统的安装与维护

6 对企业、组织或个人的资产进行规划、监督和管理

三 网络排错思路

网络故障排错的方法

1> 重置 重启 重装 解决90%的内容
2> OSI 参考模型定位法 二层不通看交换 三层不通看路由

分层法很简单,所有模型都遵循相同的基本前提:

当模型的所有低层结构工作正常时,它的高层结构才能正常工作。

一般建议在处理故障时,从参考模型自底向上进行故障排查。

3> 替换设备的方式来解决方式

替换法是检查硬件问题最常用的方法之一。

当怀疑是网线问题时,更换一根确定是好的网线试一试;当怀疑是接口模块有问题时,更换一个其它接口模块试一试。

4> 流量统计法

通常情况下,网络中业务流量的路径是在网络规划阶段就已经设计好的,

只需要知道受到网络故障影响的业务的流量往返路径,跟踪此路径,

逐步排除即可。

5>对比法

对比配置法是指对比正常状态与故障状态下的配置、软件版本、硬件型号等内容,检查两者之间的差异。

经验较少的网络故障排除人员在实践中会更多的使用到这种方法

6>分块处理发

管理部分(路由器名称、口令、服务、日志等)

端口部分(地址、封装、cost、认证等)

路由协议部分(静态路由、RIP、OSPF、BGP、路由引入等)

策略部分(路由策略、策略路由、安全配置等)

接入部分(Console登录、Telnet登录、拨号等)

其他应用部分(DNS、DHCP、VPN配置等)

7>分段处理法

数据包转发过程中可能经过多台路由器和物理链路,每段物理连接都有可能发生故障,因此分段处理的方法是有效的。

8> 镜像端口处理法
9> 设备上抓包
10> 分段处理法/分组处理法
11> 最后一招 最短路径优先原则,从最近到远 依次排错

在自己做项目的过程中遇到的错误

1>IP地址配置错误
2>子网掩码配置错误
3>Vlan接口模式配置错误
4>生成树协议在配置的过程中优先级配置错误
5>终端配置错误
6>没有关闭防火墙
7>防火墙出现乱码问题
8>DHCP 部署有问题
9>ACL 的流量出入接口接反了
10>配置自动链路聚合时没有选择主动端
11>DHCPSnoping功能没有开启
12>防火墙的管理口没有配置
13>IP地址冲突
14>双机热备组网问题

四 企业项目改造

1 企业网络项目

项目背景:

由于企业业务不断扩大,涉及到的数据量也随之增加,而原有的设备已经使用了很长时间,导致信息化建设落后,无法满足企业业务的需求。同时,信息科主任反映核心交换机经常有端口无故不转发业务,这直接影响了企业的业务运营。为解决这些问题,企业需要进行信息化升级,包括更新设备、优化网络拓扑结构、建立健全的监控与维护体系。

2>项目规模:

 由于企业业务不断扩大,新需求不断增加,且原有设备使用年限过长,信息化建设滞后,已无法支撑业务平稳运营,信息。

3>项目阶段:

 从项目立项开始,进行现场勘查,沟通方案,招投标,设备进场、机房搬迁、网络安全设备联合调试,试运行全阶段。

4>设备选型:

接入层:CloudEngine S5755-H

汇聚层:CloudEngine S6730S-S

防护墙:  HiSecEngine USG6000F-E

路由器: NetEngine AR6000-S

5>项目周期 一个月

6>企业网络设计方案

接入层+汇聚层+核心层

7>项目实施流程

1  设备进场、设备验收、核对采购清单(注意:验收设备,不只要验收硬件设备还要注意是否有软件授权,比如防火墙的IDS、vpn等,需要购买授权)保留每台设备的序列号

2  升级系统.cc  打补丁.pat  导入授权文件.dat

3 详细分析技术要点,难点, 采集原有设备配置,翻译脚本,导入配置文件

4  配置设备 在ENSP中模拟项目

5  测试功能 (远程管理/带宽管理/SSL/VPN)

6  准备割接的方案

7  提前将线贴好标签,旧设备下电,更换新设备,上电,根据标签接线。测试业务

8  线网情况培训 完成验收资料的提交

8>网络的割接方案

1 对核心层的交换机开机,配置新的核心交换机的配置参数信息。

2 对两台设备进行开机,上电,关闭所有的物理接口。

3 在新设备与旧的设备连接一根网线,两台交换机上配置的接口为Trunk接口。

4 关闭旧的设备的核心中所有的三层转发口,开启新的核心端口,切换业务将新的设备做为三层转发,旧的设备做为二层接入。

5 将新部署的光纤跳线按照标签接入 S7706 (建议与原设备保持一致)

6 核心交换机替换完成,并测试业务

7 依次替换接入层交换机,拔掉旧线,接入至机房的新光纤

8 关掉旧核心设备,拆除中间的trunk线,此时业务割接完成

9>项目业务需求

1.所有设备升级为最新的版本和补丁文件,所有设备通过telnet远程登录。设计带内管理地址,接入侧交换机管理地址为192.168.255.0/24网段

2.内网通过dhcp地址池自动获取地址

3.生产部不可以访问财务部,财务部可以访问生产部          模拟器没有效果

4.生产部、技术部可以访问web服务器,市场部和财务部可以访问FTP服务器

6.其他内网业务互联互通

7.联通外网访问内网web服务器,电信外网访问内网ftp服务器

8.源NAT地址转换。

9.出口防火墙通过策略路由出口选路,生产部,技术部走联通;市场部,财务部走电信。

当一个链路故障,切换到另一个链路。