1
概述
收集日志不仅可以用于故障定位,也可以用来检查网络设备的运行状况和定期
巡检。收集日志、分析日志,是网络专业从业技术人员必备的基础技能。
本文档适用于华为和华三设备,他们提供了一个打印诊断信息的命令,这个命
令相当于批处理程序,它把多个
display
命令都封装在一个命令中执行,省去了工
程师逐个
display
的麻烦。这也是唯一一个无论如何都不可以忘记的命令,当你无
能为力的时候这个命令可以为远程协助你的人提供重要的定位信息。
CISCO
设备并没有提供类似的功能,如果获取
CISCO
设备日志,需要工程师
一路
show
下去。本文主要以华为设备为例说明在庞大的日志文件中如何快速找到
想要的信息。华三设备可参考,但不是全部。
2
日志收集
分析日志的前提是先打印日志,华为设备提供将日志打印到文件,但是我们并
不推荐,主要理由有两个:
1
)不确定日志何时打完;
2
)还是需要网络连接上去下载的。
开始打印之前最好是通过网络的方式连接到被管理设备上,并且开启终端日志
捕获。虽然串口方式连接打印日志也可以,但是因为串口的速率太慢,需要打印
的时间比较长,在集群场景下可能会长到让人无法忍受。
当所有的命令和操作都被忘记之后也不能被忘记的一个命令操作,这是新手现
场工程师寻求他人帮助的基本前提。无论是在用户视图,还是在全局视图都可以
调用,而且效果也一样,但是我们还是推荐在用户视图下操作。命令如下:
<Huawei>display diagnostic-information
设备健康状况可以通过一个命令进行查看,可查到电压信息、温度信息、电源
信息、风扇信息、
CPU
及内存占用率等信息,命令是:
<Huawei>display health
了解如何通过网络连接到被管理设备,并捕获终端打印出来的文本的相关操作。
3
查找的艺术——关键字
通过诊断信息打印收集到的信息量巨大,如何在巨大的信息量中找到自己想要
的东西?通过“查找”直接定位!这就涉及到查找关键字,文档会花大篇幅来介
绍查找关键字。
3.1
查看设备状态
主要是查看设备的运行状态或单板运行状态,这在升级或业务割接时非常必要。
可用如下关键字查找:
display device
display slot
3.2
设备序列号
当用户需要获取设备的售后服务和申请
License
时,需要提供设备的序列号或
部件序列号。可用如下关键字查找:
display esn
display sn
3.3
设备电子标签
硬件返修需要提供电子标签,查找关键字:
display elabel
display elabel backplane
3.4
查看电源和功率信息
有些稀奇古怪的问题可能是电源功率造成的,确定电源功率,可用查找关键字:
display power
display power system
3.5
查看风扇状态
风扇是一个机械运转的部件,长时间运转之后容易发生故障,另外在夏季或环
境条件欠佳的机房里,风扇的工作状态非常值得关注。可用查找关键字:
display fan
3.6
查看设备温度
设备运行温度是一个对设备的正常运行和使用寿命非常重要。可用查找关键字:
display temperature
3.7
查看光模块信息
在组网早期,光功率及光模块状态非常受关注,经常需要排查是否是因为光路
或器件问题导致的线路不通。 可用查找关键字:
display transceiver
3.8
查看设备告警信息
很多时候设备会通过告警的形式上报异常信息,帮助我们了解设备运行情况,
协助定位问题。可用如下关键字查找:
display alarm active
display alarm history
display trapbuffer
3.9
检查配置文件
1
) 有没有做
vlan
划分,如何划分的,可用如下关键字查找:
display current
vlan
display vlan
2
) 有没有做其它分割网络广播域的措施,常用查找关键字如下:
display current
port-isolate
3
) 有没有做用户管理,登录验证,常用查找关键字如下:
display current
user-interface
aaa
3.10
检查接口运行状态
1
)查看端口状状态,常用查找关键字如下:
display interfaces
2
)端口是否开启,关注点如下:
Ethernet1/0/1 current state : UP
3
)速率及双工模式,关注点如下:
Port hardware type is 100_BASE_TX
100Mbps-speed mode, full-duplex mode
Link speed type is autonegotiation, link duplex type is autonegotiation
4
)数据量大小,占本接口的百分比,关注点如下:
Last 300 seconds input: 8 packets/sec 2970 bytes/sec
Last 300 seconds output: 9 packets/sec 3671 bytes/sec
5
)错误统计及包丢弃,关注点如下:
Input: 0 input errors
Output: 0 output errors
6
)接口信息摘要
display interfaces brief
3.11
查看系统运行状态
1
) 内存利用率有没有超过
80%
,常用查找关键字如下:
display memory
1
)
CPU
利用率有没有超过
80%
,常用查找关键字如下:
display cpu
3.12
查看系统日志
1
) 最近有没有报过什么错误,这些错误现在还存在不,常用查找关键字如下:
display logbuffer
display trapbuffer
2)
查看系统日志时应结合系统当前时间,常用查找关键字如下:
display clock
3.13
查看软件版本
报告故障需要或寻求帮助时往往需要提供软件版本,常用查找关键字如下:
display version
4
列出你看到的问题
看到什么问题,有什么针对性改进建议?