HashMap疑难杂问

本文详细探讨了JDK1.8 HashMap的实现原理,包括存储结构、哈希桶数组索引确定、扩容机制以及线程不安全性。HashMap采用数组+链表+红黑树实现,当链表长度超过8时转为红黑树。在扩容时,HashMap的优化减少了冲突并提高了性能。然而,HashMap不是线程安全的,可能导致死循环和数据不一致。解决方案包括使用ConcurrentHashMap或同步机制。
摘要由CSDN通过智能技术生成

jdk 1.8 HashMap

  JDK1.8对HashMap底层的实现进行了优化,例如引入红黑树的数据结构和扩容的优化等。
  存储结构:HashMap是数组+链表+红黑树(JDK1.8增加了红黑树部分)实现的。从源码可知,HashMap类中有一个Node[] table数组,即哈希桶数组。Node是HashMap的一个内部类,实现了Map.Entry接口,本质就是一个映射(键值对)。
  首先,Node[] table的初始化长度length(默认值是16),Load factor为负载因子(默认值是0.75),threshold是HashMap所能容纳的最大数据量的Node(键值对)个数。(threshold = length * Load factor)。超过threshold就重新resize(扩容),扩容后的HashMap容量是之前容量的两倍。
  java.util.HashMap不是线程安全的,因此在使用迭代器Iterator的过程中,如果有其他线程修改了map,将抛出ConcurrentModificationException,这就是所谓fail-fast策略。这一策略在源码中的实现就是通过modCount,它记录修改次数,在迭代器初始化过程中会将这个值赋给迭代器的expectedModCount,在迭代过程中,判断modCount跟expectedModCount是否相等,如果不相等就表示已经有其他线程修改了Map。
  在HashMap中,哈希桶数组table的长度length大小必须为2的n次方,HashMap采用这种非常规设计,主要是为了在取模和扩容时做优化,同时减少冲突,HashMap定位哈希桶索引位置时,也加入了高位参与运算的过程。当链表长度太长(默认超过8)时,链表就转换为红黑树,利用红黑树快速增删改查的特点提高HashMap的性能。

功能实现

确定哈希桶数组索引位置

这里的Hash算法本质上就是三步:
(1) 取key的hashCode值,h = key.hashCode()
(2) 高位参与运算,h ^ (h >>> 16)
(3) 取模运算,h & (length-1)

  对于任意给定的对象,只要它的hashCode()返回值相同,那么程序调用方法一所计算得到的Hash码值总是相同的。首先想到的就是把hash值对数组长度取模运算,这样一来,元素的分布相对来说是比较均匀的。但是,模运算的消耗还是比较大的,在HashMap中通过h & (table.length -1)来得到该对象的保存位,而HashMap底层数组的长度总是2的n次方,这是HashMap在速度上的优化。当length总是2的n次方时,h& (length-1)运算等价于对length取模,也就是h%length,但是&比%具有更高的效率。
  在JDK1.8的实现中,优化了高位运算的算法,通过hashCode()的高16位异或低16位实现的:(h = k.hashCode()) ^ (h >>> 16),主要是从速度、功效、质量来考虑的,这么做可以在数组table的length比较小的时候,也能保证考虑到高低Bit都参与到Hash的计算中,同时不会有太大的开销。

扩容机制

在这里插入图片描述
JDK 1.8扩容时,数据存储位置重新计算的方式
在这里插入图片描述
在这里插入图片描述
  HashMap对象内部的数组无法装载更多的元素时,对象就需要扩大数组的长度,以便能装入更多的元素。方法是使用一个新的数组代替已有的容量小的数组。JDK1.8做了哪些优化:使用的是2次幂的扩展(指长度扩为原来2倍),所以,元素的位置要么是在原位置,要么是在原位置再移动旧容量的位置。元素在重新计算hash之后,因为n变为2倍,那么n-1的mask范围在高位多1bit。因此,在扩充HashMap的时候,不需要像JDK1.7的实现那样重新计算hash,只需要看看原来的hash值新增的那个bit是1还是0就好了,是0的话索引没变,是1的话索引变成“原索引+扩容前的旧容量”。这个设计既省去了重新计算hash值的时间,而且同时,由于新增的1bit是0还是1可以认为是随机的,因此resize的过程,均匀的把之前的冲突的节点分散到新的bucket了。这一块就是JDK1.8新增的 优化点。有一点注意区别,JDK1.7中rehash的时候,旧链表迁移新链表的时候,如果在新表的数组索引位置相同,则链表元素会倒置,但是JDK1.8不会倒置。

HashMap到底是插入链表头部还是尾部

在jdk1.8之前是插入头部的,在jdk1.8中是插入尾部的。
分析链表插入的位置,重点是分析HashMap的put方法。

jdk1.6
put方法的代码如下:

public V put(K key, V value) {
   
     if (key == null)
         return putForNullKey(value);
     int hash = hash(key.hashCode());
     int i = indexFor(hash, table.length);
     for (Entry<K,V> e = table[i]; e != null; e = e.next) {
   
         Object k;
         //如果发现key已经在链表中存在,则修改并返回旧的值
         if (e.hash == hash && ((k = e.key) == key || key.equals(k
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值