http://www.programlife.net/windbg-high-cpu-debug.html
在一个任务中使用多线程编程,程序运行一段时间后就占满了CPU,严重拖慢系统运行速度。这里所说的高CPU,意思就是一个线程占用了一个CPU的大部分运行时间,如果是单核的CPU,表现为CPU占用近100%;相应的双核的话一个线程会占到50%的CPU。
我的电脑是双核四线程的CPU,所以当一个线程死循环的时候会占用掉25%的CPU时间。具体表现为:运行程序的最开始表现正常,随后会看到CPU占用上升至25%、50%、75%等。在这样的情况下我用Windbg Attach到目标进程,并通过!runaway命令来列出各线程所耗费的时间。占用时间最多的就是那些假死的线程了,然后~*kb列出各线程的调用栈,分析一下耗费时间长的线程的调用栈基本可以找出问题所在的原因。
回到我的程序,从调用栈上并不能明显看出问题:一个线程“卡”在recv上,另一个“卡”在select上面;但也不应该耗费如此多的CPU时间。再看一下代码,外层有一个while死循环,用于处理Client发过来的数据,问题基本实在这个while循环里面。再后来,仔细阅读代码后发现原因如下:
- 对recv、select之类的函数返回值判断不全,如果出错应当break
- while内部每一次循环之后应当适当的Sleep
这样处理之后,线程占满CPU的问题就得到解决了。由于一些原因,这里没有把实际情况下的一些分析数据贴出来。
P.S. 使用Process Explorer也能简单排查问题线程。双击进程可以查看进程的属性,然后选择“线程”选项卡,双击高CPU的线程就可以看到调用栈了。