服务器定位普通sas磁盘故障的方法:
1.more /var/log/messages|grep 'Medium Error'
2.执行smartctl -a /dev/sdk 查看到磁盘Raw_Read_Error_Rate和Reallocated_Sector_Ct的RAW_VALUE值比较大,怀疑磁盘故障。
3.smartctl -i /dev/sdk 收集磁盘的序列号Serial Number。
服务器定位nvme磁盘故障的方法:
1.nvme list
nvme list命令可以查看到NVME 磁盘的SN号信息。如果查不到信息,用ll /dev/disk/by-id|grep nvme
2.nvme smart-log /dev/nvmeXn1 查看磁盘的详细情况,一般media_errors超过10000,就需要报修磁盘了。
使用dmesg命令定位网卡故障日志:
dmesg -T 可以查看故障时间。使用ifconfig 可以查看网卡dropped的数据包,并且可以看到device eth0 entered promiscuous mode。
查看服务器僵尸进程的方法:
ps -A -o stat,ppid,pid,cmd |egrep '^[Zz]'
杀掉僵尸进程的指令:
kill -9 `ps -A -o stat,ppid,pid,cmd |egrep '^[Zz]'`