NMI watchdog :BUG:softlockup 解决方案

文章探讨了服务器CPU死锁的常见原因,如电源问题、vCPU过载、磁盘I/O等,重点在于当vCPU数量超过物理核数且NFS服务磁盘I/O高时的解决方案。提供临时和永久修改watchdog_thresh的建议,但强调实际应用需考虑具体情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题现象:
在这里插入图片描述
解决方案:

解决办法:
设置为30s覆盖到配置文件中
echo 30 > /proc/sys/kernel/watchdog_thresh 查看tail -1 /proc/sys/kernel/watchdog_thresh
30临时生效
sysctl -w kernel.watchdog_thresh=30
常见原因:
1>服务器电源供电不足,导致CPU电压不稳导致CPU死锁
2>vcpus超过物理cpu实际核数
3>虚机所在的宿主机的CPU负载较高或磁盘IO太高
4>虚机CPU负载较高或磁盘IO太高
5>VM网卡驱动存在bug,处理高水位流量时存在bug导致CPU死锁
6>BIOS开启了超频,导致超频时电压不稳,容易出现CPU死锁
本次出现的原因是:
因为开启多台虚拟机vcpu数量超过实际物理核数,同时虚拟机作为NFS 服务端磁盘IO也比较高

– 永久生效
echo 30 > /proc/sys/kernel/watchdog_thresh
– 临时生效
sysctl -w kernel.watchdog_thresh=30
可以通过修改/proc/sys/kernel/softlockup_thresh来修改超时的阈值

说明:该解决方案不具备权威性 以实际情况为重

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值