java中HashMap在多线程环境下引起CPU100%的问题解决

最新推荐文章于 2023-09-06 23:01:13 发布

shuaijie

最新推荐文章于 2023-09-06 23:01:13 发布

阅读量396

点赞数

分类专栏： jdk 文章标签： jdk hashmap 多线程

jdk 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

最近项目中出现了Tomcat占用CPU100%的情况，原以为是代码中出现死循环，后台使用jstack做了dump，发现是系统中不合理使用HashMap导致出现了死循环（注意不是死锁）。

产生这个死循环的根源在于对一个未保护的共享变量 — 一个"HashMap"数据结构的操作。当在所有操作的方法上加了"synchronized"后，一切恢复了正常。

这算jvm的bug吗？应该说不是的，这个现象很早以前就报告出来了（详细见：http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6423457）。Sun的工程师并不认为这是bug，而是建议在这样的场景下应采用"ConcurrentHashMap"，

回复中的原话：

This is a classic symptom of an incorrectly synchronized use of
HashMap. Clearly, the submitters need to use a thread-safe
HashMap. If they upgraded to Java 5, they could just use ConcurrentHashMap.

所以在开发过程中应当注意这点，在多线程的环境下，尽量使用ConcurrentHashMap。

可能出现问题的地方是在扩容的时候

void resize(int newCapacity) {  
        Entry[] oldTable = table;  
        int oldCapacity = oldTable.length;  
        if (oldCapacity == MAXIMUM_CAPACITY) {  
            threshold = Integer.MAX_VALUE;  
            return;  
        }  
  
        Entry[] newTable = new Entry[newCapacity];  
        transfer(newTable);  
        table = newTable;  
        threshold = (int)(newCapacity * loadFactor);  
    }

这个方法本身没有问题，问题出在transfer(newTable);这个方法是用来移动oldTable里的数据到newTable里。

/** 
    * Transfers all entries from current table to newTable. 
    */  
   void transfer(Entry[] newTable) {  
       Entry[] src = table;  
       int newCapacity = newTable.length;  
       for (int j = 0; j < src.length; j++) {  
        //(1)  
           Entry<K,V> e = src[j];  
           if (e != null) {  
               src[j] = null;  
               do {  
                //(2)  
                   Entry<K,V> next = e.next;  
                   int i = indexFor(e.hash, newCapacity);  
                //(3)  
                   e.next = newTable[i];  
                   newTable[i] = e;  
                   e = next;  
               } while (e != null);  
           }  
       }  
   }

下面分析可能出现的情况，假设原来oldTable里存放a1,a2的hash值是一样的，那么entry链表顺序是：

P1:oldTable[i]->a1->a2->null

P2:oldTable[i]->a1->a2->null

线程P1运行到(1)下面这行时，e=a1(a1.next=a2),继续运行到（2）下面时，next=a2。这个时候切换到线程P2，线程P2执行完这个链表的循环。如果恰a1,a2在新的table中的hash值又是一样的，那么此时的链表顺序是：

主存:newTable[i]->a2->a1->null

注意这个时候，a1,a2连接顺序已经反了。现在cpu重新切回P1，在（3）这行以后：e.next = newTable[i];即：a1.next=newTable[i];

newTable[i]=a1;

e=a2;

开始第二次while循环(e=a2,next=a1)：

a2.next=newTable[i];//也就是a2.next=a1

newTable[i]=a2

e=a1