一 网络割接流程
1.1 设备割接的原因:
设备老旧,导致设备性能不能满足当前业务需求等
1.2 设备割接的目的:
替换/扩容/改造/变更 新设备满足当前业务需求
1.3 信息收集
1 查看设备中的一些命令进行收集
2 对割接的现场进行查看 设备的型号 端口 对有些重要的业务信息打上标签
3 对割接的现场进行脚本收集
4 根据现场的环境在ENSP 中构建括谱图,这样做到心中有数
5 确认收集到信息后 跟现场的主管商割接的流程
1.4 翻译脚本
- 1 下载软件 补丁文件 系统文件 授权文件
- 2 在ENSP 中模拟割接项目中的业务环境,重点分析流量的走向
- 3 分析自己保存的脚本 查看是否有风险
- 4 对于自己收集到脚本形成表格 比如 插线表,ENSP括谱图,端口的状态,路由的信息,互联信息,割接的步骤表的流程
1.5 实施过程
1.5.1 割接实施过程前期准备
割接开始前对所有的设备进行脚本的收集 防止设备的脚本信息有改变
1.5.2 割接实施过程中期的准备
- 保存割接前设备的所有配置信息
- 收集arp 信息 方便日后的业务测试
- 根据割接方案中的步骤进行操作
- 割接完成后对所有的设备上架,对业务进行处理
- 收集割接后项目中的所有的项目配置信息
1.5.3 割接实施过程后期的准备
验收环节
整个项目割接流程完毕
对本次操作的所有的项目的配置文件,括谱图,管理地址,设备序列号,资料交接,客户培训
二 网络运维工作内容
巡检的工作内容:
一 对机房内的环境进行查看 (机房的系统,网络的布线,光纤道布线)
检查项 | 方法/工具 | 评估标准和说明 |
设备摆放位置 | 观察 | 设备应放在通风、干燥的环境中,且放置位置牢固、平整。设备周围不得有杂物堆积。 |
机房温度状况 | 观察/温度计 | 通常要求机房长期工作环境温度:0℃~45℃;短期工作环境温度:-5℃~55℃。 |
机房湿度状况 | 观察/湿度计 | 通常机房的长期工作环境相对湿度应在5%RH~85%RH之间,不结露;短期工作环境相对湿度应在0%RH~95%RH之间,不结露。 |
机房内空调运行是否正常 | 观察/空调 | 空调可持续稳定运行,使机房的温度和湿度保持在设备规定范围内。 |
清洁状况 | 观察 | 所有项目都应干净整洁无明显尘土附着。注意防尘网的清洁状况,及时清洗或更换,以免影响机柜门及风扇框的通风、散热。 |
散热情况 | 观察 | 设备正常工作时,要求保持风扇正常运转(清理风扇期间除外),擅自关闭风扇会引起设备温度升高,并可能损坏单板。不要在设备子架上通风口处放置杂物,还应定期清理风扇的防尘网。 |
线缆布放 | 观察 | 电源线与业务线缆分开布放。电源线布放整齐、有序。业务线缆布放整齐、有序。 |
接地方式及接地电阻是否符合要求 | 观察 | 一般要求机房的工作地、保护地、建筑防雷地分开设置,因机房条件限制,可采用联合接地。尤其对于户外使用的设备,设备接地非常重要,如果未接地容易造成雷击损坏。 |
供电系统是否正常 | 观察/电压表 | 要求供电系统运行稳定。直流额定电压范围为–48V DC~–60V。交流额定电压范围为100V~240V。 |
… | … | … |
对机房设备环境检查
- 1>机房内空调运行是否正常
- 2>电源连接是否正常可靠
- 3>机房温度和湿度状况
- 4>设备位置摆放是否合理、牢固
- 5>接地方式及接地电阻是否符合要求
- 6>供电系统是否正常
- 7>对防火墙的设备存在安全风险的检查
对机房内的所有设备进行查看
(查看设备重点基本信息,查看设备的状态信息,对设备的信息查看)
2.1 设备基本信息检查
检查项 | 检查方法 | 评估标准 |
设备运行的版本 | display version | 单板PCB版本号、软件版本号与要求相符。 |
检查软件包 | display startup | 检查下述系统文件名是否正确:当前启动大包名;下次启动大包名;备份大包名;配置、许可文件、补丁、当前启动文件名和下次启动文件名。 |
License信息 | display licensedisplay license state | 查看GTL License文件名、版本及配置项是否符合要求,确认是否需要升级。“Master board license state”项为“Normal”。“Master board license state”项为“Demo”或“Trial”时,确认License在有效期内。 |
检查补丁信息 | display patch-information | 补丁文件必须与实际要求一致,建议加载华为公司发布的该产品版本对应的最新的补丁文件。补丁必须已经生效,即补丁的总数量和正在运行的补丁数量一致。 |
检查系统时间 | display clock | 系统时间需要与网络管理服务器的时间保持一致(误差不超过5分钟)。 |
检查Flash/SD卡/CF卡空间 | dir flash、dirslave#cfcard | Flash/SD卡/CF卡里的文件都必须是有用的,否则请在用户视图下执行delete/unreserved命令删除。 |
信息中心 | display info-center | “Information Center”项为“enabled”。 |
检查配置正确性 | display current-configuration | 通过查看当前生效的配置参数,验证设备配置是否正确。 |
检查debug开关 | display debugging | 设备正常运行时debug开关应该全部关闭。 |
检查配置是否保存 | compare configuration | 当前的配置和下次启动的配置文件内容一致。 |
… | … | … |
- <HUAWEI>display version //设备运行的版本
- <HUAWEI> display startup //检查软件包
- <HUAWEI>display patch-information //检查补丁信息
- <HUAWEI> display clock //检查系统时间
- <HUAWEI> dir flash: //检查Flash空间
- <HUAWEI>display current-configuration //检查配置正确性
- <HUAWEI> display debugging //检查debug开关
- <HUAWEI> compare configuration //检查配置是否保存
2.2 设备的运行检查
检查项 | 检查方法 | 评估标准 |
单板运行状态 | display device | 重点关注单板在位信息及状态信息是否正常。单板“Online”为“Present”;单板“Power”为“PowerOn”;单板“Register”为“Registered”;单板“Alarm”为“Normal”。 |
设备复位情况 | display reset-reason、display reboot-info | 通过查看复位信息(包括复位时间、复位原因),确认无非正常复位。 |
设备温度 | display temperature、display environment | 各模块当前的温度应该在上下限之间。 |
风扇状态 | display fan | Present项为YES表示正常。 |
电源状态 | display power | State项为Supply表示正常。 |
FTP网络服务端口 | display ftp-server | 不使用的FTP网络服务端口要关闭。 |
告警信息 | display alarm all | 无告警信息。如果有告警,需要记录,对于严重以上告警需并立即分析并处理。 |
CPU状态 | display cpu-usage | 各模块的CPU占用率正常。如果CPU占用率如果超过80%,建议重点关注。 |
内存占用率 | display memory-usage | 内存占用情况正常,如果“Memory Using Percentage Is”超过60%时需要关注。 |
日志信息 | display logbuffer、display trapbuffer | 不存在异常信息。 |
主用板/备用板的备份状态 | display switchover state | 主备板同时存在时,要同时有主备板的显示状态信息。倒换完成,设备开始正常工作后,主用板需要显示为“realtime or routine backup”表示正常。 |
… | … | … |
- <HUAWEI> display device //子卡运行状态
- <HUAWEI> display reboot-info //设备复位情况
- <HUAWEI> display temperature //设备温度
- <HUAWEI> display alarm urgent //告警信息
- <HUAWEI> display cpu-usage //CPU状态
- <HUAWEI> display memory-usage //内存占用率
- <HUAWEI> display logbuffer //日志信息
- <HUAWEI> display trapbuffer //日志信息
2.3 端口的内容检查
检查项 | 检查方法 | 评估标准 |
接口错包 | display interface | 业务运行时,要检查接口有无错包,包括CRC错包等。 |
接口协商模式 | display interface | 接口协商模式正确,两边接口要一致,不能有半双工模式。 |
接口配置 | display current-configuration interface | 接口的配置项合理,如接口双工模式、协商模式、速率、环回配置等。 |
接口状态 | display interface brief | 接口的Up/Down状态满足规划要求。接口的收发流量是否过大?(长期超过70%) |
PoE供电 | display poe power-state interface interface-type interface-number | PoE供电状态正常,“Port power ON/OFF”为“ON”的接口,其“Port power status”为“Delivering-power”。 |
... | … | … |
- <HUAWEI> display interface // 检查端口错包
- <HUAWEI> display interface // 端口协商模式
- <HUAWEI> display current-configuration interface // 端口配置
- <HUAWEI> display interface brief // 端口状态
- <HUAWEI> display poe power-state interface //POE供电
2.4 运行业务的检查
检查项 | 检查方法 | 评估标准 |
MAC地址表信息 | display mac-address | MAC地址表信息正确 |
VLAN信息 | display vlan | 查看所有VLAN的基本信息 |
路由表信息 | display ip routing-table | 具有默认路由或者其他精确路由,便于故障时候可以远程定位 对于处于一个网络中同一层次的设备,如果运行相同的路由协议,各设备上的路由条目应该相差不大(因为静态路由的配置差异,路由条目上可能存在一定差异) |
OSPF邻居状态IS-IS邻居状态BGP邻居状态 | display ospfpeerdisplay isispeerdisplay bgppeer | OSPF邻居状态:邻居状态“State”为“Full”或者”2-Way”IS-IS邻居状态:邻居状态“State”为“Up”BGP邻居状态:邻居状态“State”为“Established” |
VRRP状态 | display vrrpdisplay vrrpstatistics | 备份组中的设备的VRRP状态“State”不能同时为“Master” |
MSTP状态 | display stpbrief | 指定端口和根端口的“STP State”为“FORWARDING” |
… | … | … |
- <HUAWEI> display igmp-snooping port-info //组播成员接口和路由器接口信息
- <HUAWEI> display igmp-snooping statistics vlan //组播报文统计信息
- <HUAWEI> display dhcp snooping user-bind all //DHCP Snooping绑定表
- <HUAWEI> display mac-address //MAC地址表信息
- <HUAWEI> display ip routing-table //路由表信息
2.5 故障信息查看命令
- display diagnostic-information //基本信息
- display device //设备信息
- display interface //接口信息
- display version //版本信息
- display patch-information //补丁信息
- display elabel //电子标签信息
- display current-configuration 系统当前配置信息
- display saved-configuration 系统保存的配置信息
- display clock 时间信息
- display trapbuffer 告警信息
- display logbuffer 用户日志信息
- display memory-usage 内存使用信息
- display cpu-usage CPU使用情况
运维工作内容
1 对设备进行运维巡检(对机房的环境查看系统,网线,光纤,防火墙的设备是否存在安全风险)
2 对一些基本设备的割接处理 (比如 防火墙,交换机,路有器)
3 对机房的设备进行一些系统上的维护(比如 设备升级 去设备官网找对应型号设备的补丁文件)
4 对在运行的项目中的故障进行处理 (比如 OSI 七层架构追层排错 抓包分析)
5 对员工电脑的系统的安装与维护
6 对企业、组织或个人的资产进行规划、监督和管理
三 网络排错思路
网络故障排错的方法
1> 重置 重启 重装 解决90%的内容
2> OSI 参考模型定位法 二层不通看交换 三层不通看路由
分层法很简单,所有模型都遵循相同的基本前提:
当模型的所有低层结构工作正常时,它的高层结构才能正常工作。
一般建议在处理故障时,从参考模型自底向上进行故障排查。
3> 替换设备的方式来解决方式
替换法是检查硬件问题最常用的方法之一。
当怀疑是网线问题时,更换一根确定是好的网线试一试;当怀疑是接口模块有问题时,更换一个其它接口模块试一试。
4> 流量统计法
通常情况下,网络中业务流量的路径是在网络规划阶段就已经设计好的,
只需要知道受到网络故障影响的业务的流量往返路径,跟踪此路径,
逐步排除即可。
5>对比法
对比配置法是指对比正常状态与故障状态下的配置、软件版本、硬件型号等内容,检查两者之间的差异。
经验较少的网络故障排除人员在实践中会更多的使用到这种方法
6>分块处理发
管理部分(路由器名称、口令、服务、日志等)
端口部分(地址、封装、cost、认证等)
路由协议部分(静态路由、RIP、OSPF、BGP、路由引入等)
策略部分(路由策略、策略路由、安全配置等)
接入部分(Console登录、Telnet登录、拨号等)
其他应用部分(DNS、DHCP、VPN配置等)
7>分段处理法
数据包转发过程中可能经过多台路由器和物理链路,每段物理连接都有可能发生故障,因此分段处理的方法是有效的。
8> 镜像端口处理法
9> 设备上抓包
10> 分段处理法/分组处理法
11> 最后一招 最短路径优先原则,从最近到远 依次排错
在自己做项目的过程中遇到的错误
1>IP地址配置错误
2>子网掩码配置错误
3>Vlan接口模式配置错误
4>生成树协议在配置的过程中优先级配置错误
5>终端配置错误
6>没有关闭防火墙
7>防火墙出现乱码问题
8>DHCP 部署有问题
9>ACL 的流量出入接口接反了
10>配置自动链路聚合时没有选择主动端
11>DHCPSnoping功能没有开启
12>防火墙的管理口没有配置
13>IP地址冲突
14>双机热备组网问题
四 企业项目改造
1 企业网络项目
项目背景:
由于企业业务不断扩大,涉及到的数据量也随之增加,而原有的设备已经使用了很长时间,导致信息化建设落后,无法满足企业业务的需求。同时,信息科主任反映核心交换机经常有端口无故不转发业务,这直接影响了企业的业务运营。为解决这些问题,企业需要进行信息化升级,包括更新设备、优化网络拓扑结构、建立健全的监控与维护体系。
2>项目规模:
由于企业业务不断扩大,新需求不断增加,且原有设备使用年限过长,信息化建设滞后,已无法支撑业务平稳运营,信息。
3>项目阶段:
从项目立项开始,进行现场勘查,沟通方案,招投标,设备进场、机房搬迁、网络安全设备联合调试,试运行全阶段。
4>设备选型:
接入层:CloudEngine S5755-H
汇聚层:CloudEngine S6730S-S
防护墙: HiSecEngine USG6000F-E
路由器: NetEngine AR6000-S
5>项目周期 一个月
6>企业网络设计方案
接入层+汇聚层+核心层
7>项目实施流程
1 设备进场、设备验收、核对采购清单(注意:验收设备,不只要验收硬件设备还要注意是否有软件授权,比如防火墙的IDS、vpn等,需要购买授权)保留每台设备的序列号
2 升级系统.cc 打补丁.pat 导入授权文件.dat
3 详细分析技术要点,难点, 采集原有设备配置,翻译脚本,导入配置文件
4 配置设备 在ENSP中模拟项目
5 测试功能 (远程管理/带宽管理/SSL/VPN)
6 准备割接的方案
7 提前将线贴好标签,旧设备下电,更换新设备,上电,根据标签接线。测试业务
8 线网情况培训 完成验收资料的提交
8>网络的割接方案
1 对核心层的交换机开机,配置新的核心交换机的配置参数信息。
2 对两台设备进行开机,上电,关闭所有的物理接口。
3 在新设备与旧的设备连接一根网线,两台交换机上配置的接口为Trunk接口。
4 关闭旧的设备的核心中所有的三层转发口,开启新的核心端口,切换业务将新的设备做为三层转发,旧的设备做为二层接入。
5 将新部署的光纤跳线按照标签接入 S7706 (建议与原设备保持一致)
6 核心交换机替换完成,并测试业务
7 依次替换接入层交换机,拔掉旧线,接入至机房的新光纤
8 关掉旧核心设备,拆除中间的trunk线,此时业务割接完成
9>项目业务需求
1.所有设备升级为最新的版本和补丁文件,所有设备通过telnet远程登录。设计带内管理地址,接入侧交换机管理地址为192.168.255.0/24网段
2.内网通过dhcp地址池自动获取地址
3.生产部不可以访问财务部,财务部可以访问生产部 模拟器没有效果
4.生产部、技术部可以访问web服务器,市场部和财务部可以访问FTP服务器
6.其他内网业务互联互通
7.联通外网访问内网web服务器,电信外网访问内网ftp服务器
8.源NAT地址转换。
9.出口防火墙通过策略路由出口选路,生产部,技术部走联通;市场部,财务部走电信。
当一个链路故障,切换到另一个链路。