这篇文章只讲述为什么 HashMap 1.7 头插法为什么会死循环?
HashMap 1.7 头插法为什么会死循环?)
以前刚开始学的时候大家都说头插法会导致死循环,但是自己搜了好多篇文章看的头都晕了,都是整源码,然后又搞几张图又没什么解释,就完事了。刚入门的小菜鸟怎么看得懂,现在我来用简单易懂的方式来讲一下这个问题。
前提条件:
这里假设
1.hash算法为简单的用key mod链表的大小。
2.最开始hash表size=2,key=3,7,5,则都在table[1]中。
3.然后进行resize,使size变成4。
未resize前的数据结构如下:
如果在单线程环境下,最后的结果如下:
这里的转移过程,不再进行详述,只要理解transfer函数在做什么,其转移过程以及如何对链表进行反转应该不难。
这图中我们只需要关注 table[3]中的数据就行
然后在多线程环境下,假设有两个线程A和B都在进行put操作。线程A在执行到transfer函数中第11行代码处挂起。
此时线程A中运行结果如下:
线程A执行到 e=3时 挂起 这时候 3的指针指向了7
线程A挂起后,此时线程B正常执行,并完成resize操作,结果如下:
这里需要特别注意的点:由于线程B已经执行完毕,根据Java内存模型,现在newTable和table中的Entry都是主存中最新值:7.next=3,3.next=null。
但是由于线程A挂起在红框框起来的赋值阶段,导致现在还是旧数据
此时切换到线程A上,在线程A挂起时内存中值如下:e=3,next=7,newTable[3]=null,代码执行过程如下【带入上面的源码观看】:
//开始执行A线程
newTable[3]=e ----> newTable[3]=3
e=next ----> e=7
//继续循环
e=7
next=e.next ----> next=3 【从主存中取值】
e.next=newTable[3] ----> e.next=3 【从主存中取值 这时候 7的指针指向了 3】
newTable[3]=e ----> newTable[3]=7
e=next ----> e=3
//再次进入循环
e=3
next=e.next ----> next=null
e.next=newTable[3] ----> e.next=7 即:3.next=7 【这时候3的指针指向了7,环形列表的罪魁祸首】
newTable[3]=e ----> newTable[3]=3
e=next ----> e=null 【e==null,跳出循环】
最后的结果如下:
到这儿就结束了,看懂了么大家,最后简单的解释一下死循环的过程:
在多线程情况下,同时进行扩容操作时,当一个线程在特定位置挂起,其他线程执行完扩容操作,使用头插法导致链表顺序翻转后,挂起的线程重新开始执行,由于局部变量存储的是旧数据,导致后续循环的时候指针指向的都是对方,形成环形链表,并在后续操作hashmap时造成死循环
在jdk1.8中对HashMap进行了优化,在发生hash碰撞,不再采用头插法方式,而是直接插入链表尾部,因此不会出现环形链表的情况,但是在多线程的情况下仍然是不安全
1.7还存在数据丢失,1.8数据覆盖的情况,这些问题如何发生的后续有空再解释