巡检基本步骤

1、     机房环境检查
零地电压是否小于1V
温度(摄氏 ℃)
10 ℃-40℃
湿度(%)
8% -80%
电源线的母头是否为左零右火电压值是否为240V
查看硬件情况
检查设备故障灯,一般为橙色并有故障标志。
有没有异常声响,如硬盘、风扇等。
有没有破损的电缆等
2、     主机检查
        1)系统空间使用情况,文件系统是否有“满”。命令:df –k
2)查看卷组信息,有没有"stale"状态的逻辑卷  命令:lsvg -l rootvg
        3)检查内存交换区(paging space)使用率是否超过70% 命令:# lsps –s
                                                              #lsps –a
                                          观察内存大小的命令:lsattr –El mem0
                                                        命令:vmstat 2 5
           显示从系统启动到现在使用fork(创建的进程)的数量  命令:vmstat - f
        4)当前操作系统版本                       命令 :oslevel
5)系统性能检查:
a) CPU性能:        使用Vmstat, topas来检查
b) 内存使用情况:也是使用topas, vmstat来检查
c) 检查IO平衡使用情况:使用iostat来检查
d) 交换空间使用情况:   使用lsps –a来检查
        6)网络检查
                  netstat -i 查看网卡状态
                  Ierrs/Ipkts 和 Oerrs/Opkts是否>1%
                  ping host_name /IP Address  查看是否通和是否有丢包。
                  路由表  #netstat -rn  查看路由表是否正确,ping 各路由器是否通
  核对主机名: #hostname
  #ifconfig -a
                  #lsattr –El inet0
        7)检查dump设置
                     #sysdumpdev –l
8)检查系统合法/非法登陆情况
使用Last命令来检查来自登陆的地方。
9) 检查系统是否有巨大的Core文件生成
使用 find / -name core –print来检查。对Core文件,一般直接删除就可以了。
        10)网卡的状态、IP地址、路由表等           命令:netstat –in
                                                  查看   /etc/hosts
        11)列出系统中已安装的网络适配器           命令:#lsdev -Cc adapter
                    列出系统中已配置的网络接口    命令:#lsdev -Cc if
        12) snap -a来搜索AIX系统的大部分配置信息  
        13) 查看错误报告                           命令: errpt,ssa_ela ,errpt |more
errpt -a >/tmp/errpt_20071111.txt  //将错误导出  errpt -a > errptlog.txt
errpt 查看aix的错误日志
errpt -dH    //硬件故障
errpt -dS    //软件故障 
errpt –a | pg   //获得所有错误日志的详细报告   
        14)有否发给root用户的错误报告(mail)   
        15)查看系统信息                   命令:lsconf |more
                                                 lsdev -Cc processor
lsattr -El procX
prtconf |more
bindprocessor -q 
        16)检查hacmp.out,smit.log,boot.log       命令:
lssrc -g cluster  看一下 hacmp.out      命令:tail -f /tmp/hacmp.out
在tmp里面查看有无smit.log,用vi查看
boot.log 查看:# alog -o -t boot
        17)查看卷组信息,有没有"stale"状态的逻辑卷  命令:lsvg -l rootvg
        18)使用iostat命令监控I/O                   命令:iostat 1 2
        19)查看系统定时备份情况                     命令:crontab –l   
        20)HACMP
                 检查Cluster是否运行正常
                 Cluster进程是否运行:#lssrc –g cluster,至少两个进程,且为active。
                 IP地址是否获取:#netstat –i,看boot IP是否变为service ip。
                 VG是否varyon:#lsvg –o
                 文件系统是否mount:#mount
       应用进程是否启动:#ps –ef | grep app_name

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值