网上很多资料都详细地讲解了HashMap底层的实现,但是讲到HashMap的并发操作不是线性安全时,往往一笔带过:在多个线程并发扩容时,会在执行transfer()方法转移键值对时,造成链表成环,导致程序在执行get操作时形成死循环。
对于没有研究过该过程的童鞋,很难费解这句话的含义。下面笔者分四个小节带着大家共同研究一下JDK1.7和JDK1.8版本下HashMap的线性不安全是怎么造成的,详细探究链表成环的形成过程。如果对于HashMap底层的put、get操作不清楚。
本节将详细探究HashMap扩容的键值对迁移过程,多线程并发执行transfer()方法是如何产生环形链表的。transfer()方法的代码为:
如果想学习Java工程化、高性能及分布式、深入浅出。微服务、Spring,MyBatis,Netty源码分析的朋友可以加我的Java高级交流:854630135,群里有阿里大牛直播讲解技术,以及Java大型互联网技术的视频免费分享给大家。
1 void transfer(Entry[] newTable, boolean rehash) { 2 int newCapacity = newTable.length; 3 //遍历table数组中键值对链 4 for (Entry e : table) { 5 //遍历键值对e链上的所有键值对,当e指向null时结束 6 while(null != e) { 7 Entry next = e.next;//断点一 8 //通常rehash为false,不会重新计算键值对key的hash值 9 if (rehash) {10 e.hash = null == e.key ? 0 : hash(e.key);11 }12 //根据扩容后的table数组长度计算键值对的index13 int i = indexFor(e.hash, newCapacity);14 //头插法,将后遍历的键值对存到链条的头部15 e.next = newTable[i];16 newTable[i] = e;17 //链条中的下一个键值对继续执行while循环。18 e = next;19 }20 }21 }
情景:
两个线程A、B同时向HashMap中写入键值对,某个时刻HashMap已经到了Resize的临界点。由于多线程的执行没有必然的先后顺序,存在线程A未完成扩容,而线程B又进行扩容的情况,即两个线程都可能会执行扩容方法transfer()。此时两个线程都会遍历table数组中的键值对链,对于每个链执行while循环,迁移所有键值对。
![cbfc394f61aa11e7a8a6abbdda9051b6.png](https://i-blog.csdnimg.cn/blog_migrate/157ee84648e60fb7dff448786402f5ea.jpeg)
假定HashMap中table数组的初始长度为4
假如线程A和线程B都遍历到index为2的键值链(即Entry3->Entry2->null这条链)。由于CPU时间片分配的不确定性,线程B执行到代码中断点一的位置后暂停,此时线程B中的e指向Entry3,e.next指向Entry2。而线程A继续执行,完成了扩容操作。HashMap的数据结构为下图所示。
![838e02c9a0af84b3757c9d9d43812836.png](https://i-blog.csdnimg.cn/blog_migrate/09593b0a7d09595e47081b90ca76993e.jpeg)
重点!!:e和e.next为线程B中的引用变量,分别指向hashMap中的Entry3和Entry2。由于Entry3和Entry2是线程共享的,因此受线程A执行的影响,Entry3将指向null,Entry2指向Entry3。
此时线程B中局部变量newTable的结构:
![069ce4b346d2b57849d501ba9fe1fc7f.png](https://i-blog.csdnimg.cn/blog_migrate/adb111cd8a2971360a890dc21a380de7.jpeg)
执行第一次循环:e为Entry3,e.next为Entry2(线程B暂停前e和e.next引用变量的指向)
1 //遍历e所在链上的所有键值对 2 while(null != e) { 3 //断点1,此时线程B中的e为Entry3,e.next为Entry2 4 Entry next = e.next; 5 //通常rehash为false,不会重新计算键值对key的hash值 6 if (rehash) { 7 e.hash = null == e.key ? 0 : hash(e.key); 8 } 9 //根据扩容后的table数组长度计算键值对的index10 int i = indexFor(e.hash, newCapacity);11 //头插法12 e.next = newTable[i];//将Entry3的next设置为null13 newTable[i] = e;//将Entry3放置到线程B newTable下标为3的位置14 //继续处理Entry215 e = next;16 }
如果想学习Java工程化、高性能及分布式、深入浅出。微服务、Spring,MyBatis,Netty源码分析的朋友可以加我的Java高级交流:854630135,群里有阿里大牛直播讲解技术,以及Java大型互联网技术的视频免费分享给大家。
执行完第一次循环后线程B中局部变量newTable的结构:
![37d9222ecb575a2f5e8b816fb151e9af.png](https://i-blog.csdnimg.cn/blog_migrate/b7ae6df7e4d2634b6027b4367f4e6e9c.jpeg)
执行完第一次循环后hashMap对象的结构:
![6b1746422672df94ee5fdd00012cfe9f.png](https://i-blog.csdnimg.cn/blog_migrate/baf2a1f76f93a81c31681e635b1ca4fe.jpeg)
执行第二次循环:e为Entry2,e.next为Entry3(受线程A影响,e和e.next引用变量的指向发生改变)
1 //遍历键值对e链上的所有键值对 2 while(null != e) { 3 //断点1,e为Entry2,e.next为Entry3 4 Entry next = e.next; 5 //通常rehash为false,不会重新计算键值对key的hash值 6 if (rehash) { 7 e.hash = null == e.key ? 0 : hash(e.key); 8 } 9 //由线程A的执行结果可知,Entry2的index也为310 int i = indexFor(e.hash, newCapacity);11 //头插法,12 e.next = newTable[i];//将Entry2的next设置为Entry313 newTable[i] = e; //newTable[3]设置为Entry214 //另e等于Entry3,继续执行while循环。15 e = next;16 }
执行完第二次循环后线程B中局部变量newTable的结构:
![5f5d832a30c64904946215ab4656279d.png](https://i-blog.csdnimg.cn/blog_migrate/184a24156e4ca736a8d70544583f1087.jpeg)
执行完第二次循环后hashMap对象的结构:
![53ed4cbbca250f6f04ccf814001afd59.png](https://i-blog.csdnimg.cn/blog_migrate/88ccf2e9936171e7a196119f24195bc7.jpeg)
执行第三次循环:e变为Entry3,e.next为null
1 //遍历键值对e链上的所有键值对 2 while(null != e) { 3 //断点1,此时线程B中的e变为Entry3,e.next为null 4 Entry next = e.next; 5 //通常rehash为false,不会重新计算键值对key的hash值 6 if (rehash) { 7 e.hash = null == e.key ? 0 : hash(e.key); 8 } 9 //由线程A的执行结果可知,Entry3的index为310 int i = indexFor(e.hash, newCapacity);11 //头插法12 e.next = newTable[i];//将Entry3的next设置为当前链条的首个键值对Entry213 newTable[i] = e;//newTable[3]设置为Entry314 //另e=next=null,结束while循环。15 e = next;16 }
执行完第三次循环后线程B中局部变量newTable的结构:
![6a2ba0713d982f18156564facca82629.png](https://i-blog.csdnimg.cn/blog_migrate/81df287a70785a16a4d9f99bfed969a9.jpeg)
执行完第三次循环后hashMap对象的结构:
![6a2c3c6e5af7feb1472789c23556db58.png](https://i-blog.csdnimg.cn/blog_migrate/118f14fc2f5f748bf27e7ac6b2d80423.jpeg)
至此,线程B因为改变了Entry3的next属性,在hashMap对象中产生了环形链表。下一节,将探究环形链表是如何在hashMap查询时产生死循环的。
欢迎工作一到八年的Java工程师朋友们加入Java高级交流:854630135
本群提供免费的学习指导 架构资料 以及免费的解答
不懂得问题都可以在本群提出来 之后还会有直播平台和讲师直接交流噢