linux服务器软锁死问题

- 背景
服务器卡死,查看错误日志的时候提示的是软锁死。

- 分析
那时候大家都不懂是怎么回事,都是新手,只能上网百度解决方案。百度到的信息整理如下:

1.类似这种软锁死问题基本上就是自身代码逻辑问题,仔细走读代码,分析代码流程 一步一步测试,最终定位问题根源才会彻底解决问题。

2.服务器上的软件趋于崩溃,但是又没有崩溃的状态下

3.VM网卡驱动存在bug,处理高水位流量时存在bug导致CPU死锁

4.BIOS开启了超频,导致超频时电压不稳,容易出现CPU死锁;服务器电源供电不足,导致CPU电压不稳导致CPU死锁

5.如果CPU太忙导致喂狗(watchdog)不及时,此时系统会打印CPU死锁信息

然后师兄开始研究这个watchdog,昂,反正就是研究了很多方面的。
终于有一天,他开始top查看cpu的占用情况,发现cpu超超超负荷运行ing,运行某个代码时cpu占用率四千多。所以怀疑是代码出了问题。

- 解决
发现果然是代码出问题了,没有成功调用上GPU,全程用cpu在跑,但是由于那个代码要处理的数据量和计算量很大,所以,但凡这个程序一跑,cpu就会卡死。最后,改了代码,才可以解决这个问题。

- 总结一句
综上所述,可见百度得到的信息还是很沾边的,就是没办法立即确定是代码出了问题,但核心思想是:cpu负荷太重,就卡死了。
所以,但凡再遇到这些软锁死问题,先回头研究自己的代码有没有问题,再去想别的原因。然而一般情况下都是代码有点问题。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值