服务器死机/无故宕机排查思路/服务器起不来

1、查看服务器型号
dmidecode -t system
dmidecode | grep ‘Product Name’
2、风扇异响:查看BMC,坏了一个风扇其他的所有的风扇会全速转。
3、服务器亮红灯
红灯就是 故障告警 不一定是啥··需要查看BMC口日志。这种就是看bmc日志·· 会有打印的
-问题现象:服务器系统盘亮红灯
-问题原因:系统盘磁盘脚线损坏(系统盘做了raid 1)
-解决方案:①服务器器无法通过control + R进入raid卡页面,通过bios进入可以查看raid情况,显示Need Attention。更换磁盘,磁盘自动重构raid。红灯变黄灯再变绿灯,重构完成,业务恢复正常。
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

4、死机问题:
1、确认bmc日志;是否有硬件异常告警;硬件导致死机。
2、查看/var/log/message 日志; 搜关键字command line 是开机时打印,往前即为死机前日志。;
3、主节点optimizi-memory.sh会打印内存回收,若看到每分钟都有drop_caches日志,那说明是内存不足导致死机。 确认该节点部署服务数是否合理、是否技战法导致内存占用问题。
4、未确认的死机问题;需要收集 /var/log/message* 及 /var/log

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值