HashMap疑难杂问

最新推荐文章于 2024-02-26 09:01:57 发布

K. Bob

最新推荐文章于 2024-02-26 09:01:57 发布

阅读量321

点赞数 1

分类专栏： Java

本文链接：https://blog.csdn.net/ThreeAspects/article/details/105462130

版权

本文详细探讨了JDK1.8 HashMap的实现原理，包括存储结构、哈希桶数组索引确定、扩容机制以及线程不安全性。HashMap采用数组+链表+红黑树实现，当链表长度超过8时转为红黑树。在扩容时，HashMap的优化减少了冲突并提高了性能。然而，HashMap不是线程安全的，可能导致死循环和数据不一致。解决方案包括使用ConcurrentHashMap或同步机制。

摘要由CSDN通过智能技术生成

jdk 1.8 HashMap
- 功能实现
- - 确定哈希桶数组索引位置
  - 扩容机制
HashMap到底是插入链表头部还是尾部
HashMap扩容时死循环问题
HashMap线程不安全性体现
HashMap的容量为什么是2的幂次
HashMap容量的初始化
HashMap中初始化大小为什么是16?
为什么Map桶中个数超过8才转为红黑树
HashMap负载因子为什么是0.75
HashMap的线程安全解决方案
在高并发大流量的情况下，HashMap有什么问题

jdk 1.8 HashMap

JDK1.8对HashMap底层的实现进行了优化，例如引入红黑树的数据结构和扩容的优化等。
存储结构：HashMap是数组+链表+红黑树（JDK1.8增加了红黑树部分）实现的。从源码可知，HashMap类中有一个Node[] table数组，即哈希桶数组。Node是HashMap的一个内部类，实现了Map.Entry接口，本质就是一个映射(键值对)。
首先，Node[] table的初始化长度length(默认值是16)，Load factor为负载因子(默认值是0.75)，threshold是HashMap所能容纳的最大数据量的Node(键值对)个数。（threshold = length * Load factor）。超过threshold就重新resize(扩容)，扩容后的HashMap容量是之前容量的两倍。
java.util.HashMap不是线程安全的，因此在使用迭代器Iterator的过程中，如果有其他线程修改了map，将抛出ConcurrentModificationException，这就是所谓fail-fast策略。这一策略在源码中的实现就是通过modCount，它记录修改次数，在迭代器初始化过程中会将这个值赋给迭代器的expectedModCount，在迭代过程中，判断modCount跟expectedModCount是否相等，如果不相等就表示已经有其他线程修改了Map。
在HashMap中，哈希桶数组table的长度length大小必须为2的n次方，HashMap采用这种非常规设计，主要是为了在取模和扩容时做优化，同时减少冲突，HashMap定位哈希桶索引位置时，也加入了高位参与运算的过程。当链表长度太长（默认超过8）时，链表就转换为红黑树，利用红黑树快速增删改查的特点提高HashMap的性能。

功能实现

确定哈希桶数组索引位置

这里的Hash算法本质上就是三步：
(1) 取key的hashCode值，h = key.hashCode()
(2) 高位参与运算，h ^ (h >>> 16)
(3) 取模运算，h & (length-1)

对于任意给定的对象，只要它的hashCode()返回值相同，那么程序调用方法一所计算得到的Hash码值总是相同的。首先想到的就是把hash值对数组长度取模运算，这样一来，元素的分布相对来说是比较均匀的。但是，模运算的消耗还是比较大的，在HashMap中通过h & (table.length -1)来得到该对象的保存位，而HashMap底层数组的长度总是2的n次方，这是HashMap在速度上的优化。当length总是2的n次方时，h& (length-1)运算等价于对length取模，也就是h%length，但是&比%具有更高的效率。
在JDK1.8的实现中，优化了高位运算的算法，通过hashCode()的高16位异或低16位实现的：(h = k.hashCode()) ^ (h >>> 16)，主要是从速度、功效、质量来考虑的，这么做可以在数组table的length比较小的时候，也能保证考虑到高低Bit都参与到Hash的计算中，同时不会有太大的开销。

扩容机制

在这里插入图片描述
JDK 1.8扩容时，数据存储位置重新计算的方式

HashMap对象内部的数组无法装载更多的元素时，对象就需要扩大数组的长度，以便能装入更多的元素。方法是使用一个新的数组代替已有的容量小的数组。JDK1.8做了哪些优化：使用的是2次幂的扩展(指长度扩为原来2倍)，所以，元素的位置要么是在原位置，要么是在原位置再移动旧容量的位置。元素在重新计算hash之后，因为n变为2倍，那么n-1的mask范围在高位多1bit。因此，在扩充HashMap的时候，不需要像JDK1.7的实现那样重新计算hash，只需要看看原来的hash值新增的那个bit是1还是0就好了，是0的话索引没变，是1的话索引变成“原索引+扩容前的旧容量”。这个设计既省去了重新计算hash值的时间，而且同时，由于新增的1bit是0还是1可以认为是随机的，因此resize的过程，均匀的把之前的冲突的节点分散到新的bucket了。这一块就是JDK1.8新增的 优化点。有一点注意区别，JDK1.7中rehash的时候，旧链表迁移新链表的时候，如果在新表的数组索引位置相同，则链表元素会倒置，但是JDK1.8不会倒置。

HashMap到底是插入链表头部还是尾部

在jdk1.8之前是插入头部的，在jdk1.8中是插入尾部的。
分析链表插入的位置，重点是分析HashMap的put方法。

jdk1.6
put方法的代码如下：

public V put(K key, V value) {
   
     if (key == null)
         return putForNullKey(value);
     int hash = hash(key.hashCode());
     int i = indexFor(hash, table.length);
     for (Entry<K,V> e = table[i]; e != null; e = e.next) {
   
         Object k;
         //如果发现key已经在链表中存在，则修改并返回旧的值
         if (e.hash == hash && ((k = e.key) == key || key.equals(k

最低0.47元/天解锁文章

K. Bob

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HashMap疑难杂问

HashMap到底是插入链表头部还是尾部在jdk1.8之前是插入头部的，在jdk1.8中是插入尾部的。分析链表插入的位置，重点是分析HashMap的put方法。jdk1.6put方法的代码如下：public V put(K key, V value) { if (key == null) return putForNullKey(value); in...
复制链接

扫一扫

专栏目录