前言
作为一个Java开发人员,特别是资深的Java开发人员(其实只要是一个软件工程师),你一定会遇到过app挂起的问题,在英文里,挂起叫做Hangs。前一天你的软件还运行的好好的,突然就没有任何响应,无论是log file还是stand output都没有任何响应。上司或者客户给的压力让你的心焦黑。在不知道是什么问题的情况下,重启一下应用服务器,发现问题突然解决了。但没过几天,又像幽灵一样死亡缠绕。没错,这时候,你必须知道如何troubleshooting这种deadlock或者hangs的问题。
可能造成程序无响应的主要情况
Reason 1: 数据库有问题
这听起来可能有点奇怪,但大部分的应用服务器发生挂起时,其主要原因都不在应用服务器上面。如果你检查你的log或者symptom,最后的那几行打印也多半不会指向最终的root cause。以下是数据库出问题时比较常见的几种场景:
- 数据库成为瓶颈,查询速度慢于平常
- 请求的响应变慢,平时只需要一秒的请求,现在需要5秒才能完成
- 并发请求的数量在缓慢增加(从backlog上可以看出)
- 应用服务器的线程池耗光,最终导致应用服务器hangs
这时,如果查看thread dump,可能就会发现有一堆线程处于等待状态,而另一部分处于运行状态。或者是等待状态的线程不停的吃进内存,最终导致OutOfMemroy Exception。