问题:CPU资源长期使用率过高导致系统内核软死锁
服务器跑大量高负载程序,会造成cpu soft lockup
kernel watchdog是用来检测Lockup 的,所谓lockup,是指某段内核代码占着CPU不放,Lookup严重的时候会导致整个系统失去响应
Soft lockup是指CPU被内核代码占据,以至于无法执行其它进程
解决方法:
重启,账号密码登录系统
查看/proc/sys/kernel/watchdog_thresh中的参数
#tail -1 /proc/sys/kernel/watchdog_thresh
20
显示为20
修改参数,并临时生效
#sysctl -w kernel.watchdog_thresh=30
kernel.watchdog_thresh = 30
echo 覆盖,永久生效
#echo 30 > /proc/sys/kernel/watchdog_thresh
再次查看参数
#tail -1 /proc/sys/kernel/watchdog_thresh
30
我还碰到这个问题,是由于内核版本过高导致的,修改为默认内核3.10之后没有出现问题