今天同事们跑performance test的时候,发现session建到500死活上不去了。后来发现是死锁。而且居然是因为我之前忘了改的一个小东西造成的。
在原先的设计中,我们有一个singleton的slsb,内部包含了太多的方法,几千行代码。完全造成破窗效应了。后来被我重构了,把与该类无关的方法单独独立出去成为两个bean,一个slsb,一个singleton的slsb。后面创建的这个singleton其实是为了一个计数器。保证这个计数器的累加。当时同事review时曾经给我提过这个问题,当时他觉得为了一个计数器把一个slsb变成singleton有点不划算,我当时觉得问题应该不大就忘了改了。结果造成了悲剧。
这里顺便把解决过程中用到的方法记下来,免得遇到类似的问题又记不住命令。
1. 当时感觉是有死锁,于是乎用jstack去查下JVM堆栈。
jstack是JDK自带的小工具,用来查询堆栈信息。在bin目录下。
先用 jps 或 ps -ef | grep java来查询jvm的进程ID。jps也是jdk自带的小工具,用来查看本地运行的java程序及其进程号。
然后调 jstack -m {pid} >> dump.log
然后就可以打开dump.log去查询了。
里面有
Found one Java-level deadlock:============================="Thread-24 (group:HornetQ-client-global-threads-1267755881)":waiting for ownable synchronizer 0x00000007f97ca8d8, (a java.util.concurrent.locks.ReentrantReadWriteLock$NonfairSync),which is held by "Thread-17 (group:HornetQ-client-global-threads-1267755881)""Thread-17 (group:HornetQ-client-global-threads-1267755881)":waiting for ownable synchronizer 0x00000007fa0e0618, (a java.util.concurrent.locks.ReentrantReadWriteLock$NonfairSync),which is held by "pool-68-thread-7""pool-68-thread-7":waiting for ownable synchronizer 0x00000007f97ca8d8, (a java.util.concurrent.locks.ReentrantReadWriteLock$NonfairSync),which is held by "Thread-17 (group:HornetQ-client-global-threads-1267755881)"
Java stack information for the threads listed above:===================================================
类似的统计信息。
这里看到
Thread-17 跟
pool-68-thread-7相互held,导致死锁。从上面这几行下面的线程具体信息中,就可以找到他们锁定的方法。
在我的这次问题中,是因为
Thread-17 线程中的ejb拿到了原始的singleton的实例,而
pool-68-thread-7中的ejb拿到了我重构后的那个singleton的实例,该实例的方法中又需要原始singleton的实例去执行一些方法,就死锁了。fuck.....
后来把计数器改成单独一个类了,把新的singleton改成slsb,就OK了。
附上该计数器实现。
本来想把这个类变成singleton,后来想想没用,因为只要一个static的变量,而且singleton实现方式不一样搞不好还会有线程并发问题。这样反而简单了。public class SetParameterSequenceCounter {
private static AtomicInteger counter;
public static int getCounter() {
return counter.get();
}
public static void increase()
{
counter.incrementAndGet();
}
}
OK,问题解决。