linux python3负载过高,cpu负载过高案例，解决方法记录

最新推荐文章于 2022-12-17 15:14:56 发布

DeepWeaver

最新推荐文章于 2022-12-17 15:14:56 发布

阅读量564

点赞数

文章标签： linux python3负载过高

先讲下问题来源，前一段时间线上服务器负载高的吓人，作为一台只部署了tomcat的应用服务器，平时load average 也就在零点几的水平，突然达到十几真是让人惊了个呆(⊙ˍ⊙)，生怕服务器分分钟宕掉啊。

赶紧找问题发生原因吧，我以前没有遇到过这类问题，没啥经验可谈，首先服务器上top下，发现最耗cpu的就是我们的应用服务器，如图：

我马上想到的是我们有异步处理的多线程程序，是不是哪个程序死锁了或者一直跑着，不释放。于是查看了最近修改的代码，也没有发现那里可能会发生死循环，那干脆打印下堆栈看看到底都有什么线程在跑着吧。到jdk的bin路径下用jstack pid >xxx.stack命令打印堆栈内容。

快1MB的内容，真的没法去找，都是一些TIMED_WAITING，WAITING这些可以先不用去看，优先级高的应该是那些RUNNABLE的，因为都已经等待了，就消耗不到cpu了啊。看了半天也没看出啥名堂，最后在其他博客上取取经，发现了实用的技巧。

具体思路：

首先要找到哪几个线程在占用cpu,之后再通过线程的id值在堆栈文件中查找具体的线程，看看出来什么问题。

OK,实战开始，第一个命令

ps -mp pid -o THREAD,tid,time

其中pid 换成要查看的进程的id值，这个命令的作用就是打印出进程下有哪几个线程在跑，并且分别占用cpu多长时间。

对ps不熟悉话，可以在linux下查看man ps文档，看看具体那几个命令的作用

-p的后面跟着要显示的进程的id号， -m的意思是显示这个进程下的所有线程 -o的意思是格式化要输出的内容

通过上边这个命令，显示出一堆线程，通过筛选之后发现了几个占用cpu很长的线程

%CPU

TID

TIME

17.3

16172

12:18:58

79.9

16275

2-08:49:22

19.8

418

12:16:02

32.6

13071

12:17:14

这下可算找到罪魁祸首了，看第二个线程cpu占用的吓人，并且占用时间也是高的离谱，我记住它了( *⊙~⊙)。

第二个命令，将找到的线程id号转成十六进制

printf "%x\n" tid

这个很简单，就不解释了，得到结果是3f93。

之后就是在最初打印的堆栈信息中查找这个线程，Bingo！

请原谅，把关键信息注释上了，哈哈。找到这个线程，可以看到具体出问题的代码行了，对就是我注释那几个代码行，之后就在源码中查找下，发现真的有一个死循环在那里(⊙﹏⊙)b，好了既然找到了那就fix掉就可以了。

在一次上线之后服务器的情况：

又健健康康的啦~~~。

结尾再费点唾沫，查找好cpu的线程时一共有四个，其实那三个我也找了，发现是我们自己创建的线程池，所以不是问题啦。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
linux python3负载过高,cpu负载过高案例，解决方法记录

先讲下问题来源，前一段时间线上服务器负载高的吓人，作为一台只部署了tomcat的应用服务器，平时load average 也就在零点几的水平，突然达到十几真是让人惊了个呆(⊙ˍ⊙)，生怕服务器分分钟宕掉啊。赶紧找问题发生原因吧，我以前没有遇到过这类问题，没啥经验可谈，首先服务器上top下，发现最耗cpu的就是我们的应用服务器，如图：我马上想到的是我们有异步处理的多线程程序，是不是哪个程序死锁了或...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。