机房定期巡检报告报告,全面详实,可以参考,一个模板仅供参考,大家还可以补充学习
1.文档说明
为了保证设备稳定运行,发现设备在运行过程中可能存在的风险,做到防范于未然,组织人员针对目前机房所使用的防火墙及安全设备进行年度的巡检工作,本文档为第四季度巡检报告内容。
2.巡检内容及操作指导
2.1 硬件部分
2.1.1 机房要求
2.1.1.1机房的卫生状况,要求清洁,防火墙上没有灰尘。
2.1.1.2温度(摄氏 ℃)
工作环境温度0 ℃-40℃
工作环境湿度(%)10% -95%
2.1.2 电源检查
2.1.2.1电源插头有无松动。
电源无松动
2.1.2.2电源指示灯颜色:
PWR | 电源 | 绿色常亮 | 电源1工作正常 |
2.1.3 防火墙风扇
2.1.3.1风扇指示灯颜色
FAN | 风扇状态 | 绿色常亮 | 风扇工作正常 |
2.1.4 指示灯
根据指示灯状况,可迅速查看某部分出现故障,以及运行情况。
指示灯 | 用途 | 颜色 | 说明 |
STATUS | 系统状态 | 绿色闪烁 | 正常运行 |
PS | PS状态 | 绿色常亮 | 电源PS正常供电 |
HA | HA状态 | 绿色闪烁 | 有一主一备两台设备,本设备工作master状态 |
VPN | VPN状态 | 绿色常亮 | VPN隧道已连接 |
2.1.5 设备模块及数据接口检查:
2.1.5.1接口状态检查
检查模块安装是否松动,接口模块上指示灯是否正常。已接有链路的端口link端为绿色常亮,ACT指示灯为黄色闪烁。
Link | Link状态 | 绿色常亮 | 端口与对端设备通过网线或者光纤连接正常 |
ACT | ACT状态 | 黄色闪烁 | 端口处于收发状态 |
2.2 系统部分
2.2.1 软件版本检查
在设备上运行show version 查看当前软件版本,查看当前版本之后的release版本有无严重BUG修复,如有与当前运行环境有冲突的软件BUG,建议用户升级软件版本。
堡垒机:
数据库审计:
日志审计:
2.2.2温度和风扇检查
2.2.2.1温度风扇检查
检查温度如有超出标准值并是否处于正常状态,检查风扇及机扇环境,及时更换部件。
(config)# show environment
Both the temperature and fan are in normal state.
出口防火墙:
出口负载均衡:
数据中心防火墙:
2.2.2.2持续运行时间检查
在防火墙上执行show version检查防火墙持续运行时间及上次系统重启时间。
此参数值可供参考防火墙的运行稳定性。
出口防火墙:
出口负载均衡:
数据中心防火墙:
行为管理:
堡垒机:
日志审计:
2.2.3并发会话检查
在防火墙上执行命令:show session generic
每个防火墙的并发会话都有一个最值,如果超出最大值说明防火墙并发会话已经达到极限,防火墙成为一性能瓶颈,需要升级到更高档次防火墙。
会话信息如包含alloc failed说明防火墙会话曾经达到最大值,防火墙会话建立失败,可能是防火墙性能的问题或曾经出现网络攻击现象;
123# show session generic
VSYS 0, max 200000, alloced 0, deny session 0, free 200000, tunnel 0, alloc failed 0
出口防火墙:
出口负载均衡
数据中心防火墙:
2.2.4 CPU利用率检查
防火墙的CPU主要任务为执行功能、会话、日志等管理功能,一般情况下CPU利用率不会太高,建议不超过60%。
防火墙CPU统计有1分钟、5分钟、15分钟平均值。
在某一时间段CPU利率较高,属异常现象,可能有攻击等情况发生。
CPU利用率持续较高,说明防火墙配置错误,需要调整防火墙配置,以降低CPU利用率。
123# show cpu
Average cpu utilization : 0.2%
current cpu utilization : 2.0%
Last 1 minute : 0.1%
Last 5 minutes : 0.2%
Last 15 minutes : 0.2%
上网行为管理:
堡垒机:
数据库审计:
日志审计:
2.2.5 内存使用率检查
在防火墙内执行 show memory 查看内存利用率;
hillstone# show memory
The percentage of memory utilization: 25%
total(kB) used(kB) free(kB)
524288 132793 391495
出口防火墙:
出口负载均衡:
数据中心防火墙:
上网行为管理:
堡垒机:
数据库审计:
日志审计:
2.2.6 日志统计审计
提供了用于监控系统事件和网络流量的事件日志以及便于系统管理员分析和跟踪设备各种问题情况。Stoneos的日志信息分为七种,分别是事件(Event)日志信息、告警(Alarm)日志信息、安全(Security)日志信息、配置(Configuration)日志信息、网络(network)日志信息、流量(Traffic)日志信息和调试(Debug)日志信息。日志信息根据严重级别的不同,又可以分为8级别。
日志信息严重性级别分类:
ØEmergency (紧急)级别0:系统不可用信息。
ØAlert(警示)级别1:需要立即处理的信息,如设备受到攻击灯。
ØCritical(关键)级别2:危急信息,如硬件出错。
ØError (错误)级别3:错误信息。
ØWarning(警告)级别4:报警信息。
ØNotification (通知)级别5:非错误信息,但需要特殊处理。
ØInformation (信息)级别6:通知信息。
ØDebugging(调试)级别7:调试信息,包括正常的使用信息。
查看一些日志信息如下:
show logging event
show logging alarm
show logging security
该部分主要涉及出口设备(日志审计类设备主要作用就是保存日志),巡检防火墙、负载均衡、数据中心防火墙。
防火墙:
负载均衡:
数据中心防火墙:
2.2.7 路由检查
防火墙在路由模式下工作时,防火墙数据转发跟系统路由相关,检查路由设置是否正确。
123# show ip route
Codes: K - kernel route, C - connected, S - static, I - ISP, R - RIP, O - OSPF,
B - BGP, D - DHCP, P - PPPoE, H - HOST, G - SCVPN, V - VPN, M - IMPORT,
> - selected route, * - FIB route
Routing Table for Virtual Router
==========================================================================
C>* 192.168.1.0/24 is directly connected, ethernet0/0
H>* 192.168.1.1/32 [0/0/1] is local address, ethernet0/0
防火墙:
负载均衡:ISP路由信息过多,无截图
数据中心防火墙:
2.2.8 查看系统信息
获得系统的一些信息。
show tech-support
2.2.9其他安全设备
日志审计设备正常运行,配置服务器syslog信息上传到日志审计设备,保存到设备中,保存日志为180天。并且现场配置查看,能够查到服务器的日志信息。
堡垒机设备现场正常使用,检查堡垒机信息,完成堡垒机使用查看,并嘱托客户使用堡垒机运维服务器,在数据中心服务器上,封闭除了堡垒机外的主机访问服务器高危端口。
数据库审计,现场查看数据库日志,配合客户检查数据库日志,并简单说明数据库审计设备的使用方式。
上网行为管理,登陆设备,检查设备使用情况,所有用户均在配置策略中受设备管控,设备运行无问题,用户上网行为受管控、受审计,运行正常。
3.巡检报告
3.1设备基本信息汇总
防火墙设备信息:
3.2设备运行参数
设备运行参数主要有一下几种类型:
Ø设备基本状况:软件版本、设备运行时间、CPU利用率、内存使用率、HA状态、会话数、设备板卡温度、设备电源、设备风扇。
Ø可靠性检查:配置检查、日志记录情况、策略检查。
Ø路由状态:查看路由表中业务路由。
Ø保存文件:当前配置文件、备份配置文件、保存log日志。
3.3设备运行情况
3.3.1设备
序号 | 检查内容 | 情况 | 结果 | 命令 | 备注 |
硬件部分 | |||||
1 | 机房卫生 | 正常 | 正常■ 不正常□ | - | 查看机房卫生情况 |
机房环境温度 | 正常 | 正常■ 不正常□ | - | 查看机房环境温度 | |
2 | 电源插头 | 正常 | 正常■ 不正常□ | - | 查看电源插头情况 |
电源指示灯 | 正常 | 正常■ 不正常□ | - | 查看电源指示灯情况 | |
3 | 风扇运转 | 正常 | 正常■ 不正常□ | - | 查看风扇运转情况 |
风扇指示灯 | 正常 | 正常■ 不正常□ | - | 查看风扇指示灯情况 | |
4 | 系统状态指示灯 | 正常 | 正常■ 不正常□ | - | 查看系统状态指示灯情况 |
系统告警指示灯 | 正常 | 正常■ 不正常□ | - | 查看系统告警知识等情况 | |
HA状态指示灯 | 正常 | 正常■ 不正常□ | - | 查看HA状态指示灯情况 | |
VPN状态指示灯 | 正常 | 正常■ 不正常□ | - | 查看VPN状态指示灯情况 | |
板卡状态指示灯 | 正常 | 正常■ 不正常□ | - | 查看板卡状态指示灯情况 | |
系统部分 | |||||
1 | 软件版本 | 正常 | 正常■ 不正常□ | show version | 查看软件版本 |
2 | 设备温度 | 正常 | 正常■ 不正常□ | show environment | 查看设备温度,建议在0-90度之间 |
设备电源 | 正常 | 正常■ 不正常□ | show environment | 查看设备电源状态 | |
设备风扇 | 正常 | 正常■ 不正常□ | show environment | 查看设备风扇状态 | |
设备运行时间 | 正常 | 正常■ 不正常□ | show version | 查看设备运行时间 | |
3 | 并发会话数 | 正常 | 正常■ 不正常□ | show session generic | 查看设备会话数 |
4 | CPU利用率 | 正常 | 正常■ 不正常□ | show cpu | 查看CPU利用率,建议在60%以下 |
5 | 内存使用率 | 正常 | 正常■ 不正常□ | show memory | 查看内存利用率,建议在60%以下 |
6 | 日志统计情况 | 正常 | 正常■ 不正常□ | show logging alarm/event/ security | 保存相关日志记录 |
7 | 路由检查 | 正常 | 正常■ 不正常□ | show ip route | 重要业务路由是否正确 |
8 | 系统信息检查 | 正常 | 正常■ 不正常□ | show tech-support | 查看设备部分信息 |
攻击防护部分 | |||||
1 | 查看AD配置 | 正常 | 正常■ 不正常□ | show ad zone untrust configuration | 查看设备AD配置是否正常 |
2 | 查看AD记录 | 正常 | 正常■ 不正常□ | show ad zone untrust statistics | 查看设备AD记录是否正常 |
配置及策略部分 | |||||
1 | 查看配置文件 | 正常 | 正常■ 不正常□ | show configuration | 查看当前配置 |
2 | 查看地址薄 | 正常 | 正常■ 不正常□ | show adderss | 查看地址薄 |
3 | 查看服务薄 | 正常 | 正常■ 不正常□ | show services | 查看服务薄 |
4 | 查看策略 | 正常 | 正常■ 不正常□ | show policy | 查看策略配置 |
4.评估
现有设备运行稳定,没有出现软件硬件故障,可以满足当前业务的需求。
5.总结和建议
现有设备运行稳定,没有出现软件硬件故障,可以满足当前业务的需求。
资料免费送(点击链接下载)
史上最全,数据中心机房标准及规范汇总(下载)加入运维管理VIP群(点击链接查看)
扫描以下二维码加入学习群