Java基础知识中最常被问到的便是HashMap,最近也与朋友对其底层进行过争论,最终经过自个儿观读源码,以及参考广大网友的文档,留下本人的一些记忆,如有任何问题,欢迎随时指正。
未了解内部结构之前有以下的一些疑问:
1.HashMap的底层数据结构是什么样子的,如何进行存储?
HashMap的底层是数组+链表,后续在jdk1.8后加入了红黑树,主要是为了增加查询的速度。key,value的存储是在HashMap中创建了一个静态内部类 Node<K,V>,包含hash(key),key ,value, Node<K,V>这四个属性。put(key,value)方法,主要实现的就是将hash(key),key,value存到Node节点中,然后将Node节点存放到数组表中,当然,该数组是在put操作的时候才进行初始化的,包括初始化数组的大小默认为16,扩容因子为0.75(据说此数据是根据泊松定理得来的),即在数据存储达到16*0.75=12时开始进行扩容,默认为当前容量的两倍。进行存储的时候,链表用的是尾插法,即已有的链表值next指向新加入的数据。
2.HashMap如何获取具体key对应的value值?
查询操作:每次根据key值查询相对应的value时是先拿hash(key)与表的长度进行取模运算,获取到该数据存在的数组下标位置,然后判断该数组的key值和目标key是否一致,如果一致则取其Node<K,V>对象的value值返回即可,若不一致,判断其next是否有数据,没有的话,则查询失败,否则的话,进行循环判断key值是否相等,直到获取到相等的key为止,否则,查询失败。
当然,红黑树是在列表的长度达到HashMap默认的8个节点后将列表的类型转换为红黑树进行存储,提高存储查询速度。
3.HashMap为何是现成不安全的,缺少synchronized关键字,但是具体什么原因导致安全性事故?
首先在put的时候容易发生线程冲突:比如有两个线程A和B,首先A希望插入一个key-value对到HashMap中,首先计算记录所要落到的 hash桶的索引坐标,然后获取到该桶里面的链表头结点,此时线程A的时间片用完了,而此时线程B被调度得以执行,和线程A一样执行,只不过线程B成功将记录插到了桶里面,假设线程A插入的记录计算出来的 hash桶索引和线程B要插入的记录计算出来的 hash桶索引是一样的,那么当线程B成功插入之后,线程A再次被调度运行时,它依然持有过期的链表头但是它对此一无所知,以至于它认为它应该这样做,如此一来就覆盖了线程B插入的记录,这样线程B插入的记录就凭空消失了,造成了数据不一致的行为。
其次,resize而引起死循环:这种情况发生在HashMap自动扩容时,当2个线程同时检测到元素个数超过 数组大小 × 负载因子。此时2个线程会在put()方法中调用了resize(),两个线程同时修改一个链表结构会产生一个循环链表(JDK1.7中,会出现resize前后元素顺序倒置的情况)。接下来再想通过get()获取某一个元素,就会出现死循环。