深入分析HashMap

尘埃不入你眼眸

于 2021-08-27 16:47:11 发布

阅读量235

点赞数

文章标签：数据结构链表 hashmap

本文链接：https://blog.csdn.net/weixin_45079474/article/details/119952471

版权

一、传统HashMap的缺点

(1)JDK 1.8 以前 HashMap 的实现是数组+链表，即使哈希函数取得再好，也很难达到元素百分百均匀分布。
(2)当 HashMap 中有大量的元素都存放到同一个桶中时，这个桶下有一条长长的链表，这个时候 HashMap 就相当于一个单链表，假如单链表有 n 个元素，遍历的时间复杂度就是 O(n)，完全失去了它的优势。
(3)针对这种情况，JDK 1.8 中引入了红黑树（查找时间复杂度为 O(logn)来优化这个问题。

二、JDK1.8 中 HashMap 的数据结构

HashMap是数组+链表+红黑树实现的
在这里插入图片描述
HashMap中关于红黑树的三个关键参数

HashMap在JDK1.8中新增的操作：桶的树形化treeifyBin()
如果如果一个桶中的元素个数超过 TREEIFY_THRESHOLD(默认是 8 )，就使用红黑树来替换链表，从而提高速度。

(1)根据哈希表中元素个数确定是扩容还是树形化
(2)如果是树形化遍历桶中的元素，创建相同个数的树形节点，复制内容，建立起联系
(3)然后让桶第一个元素指向新建的树头结点，替换桶的链表内容为树形内容

三、分析HashMap的put方法

HashMap 的 put 方法执行过程可以通过下图来理解
在这里插入图片描述

①.判断键值对数组 table[i]是否为空或为 null，否则执行 resize()进行扩容；
②.根据键值 key 计算 hash 值得到插入的数组索引 i，如果 table[i]==null，直接新建节点添加，转向⑥，
  如果 table[i]不为空，转向③；
③.判断 table[i]的首个元素是否和 key 一样，如果相同直接覆盖 value，否则转向④，
  这里的相同指的是 hashCode 以及 equals；
④.判断 table[i] 是否为 treeNode，即 table[i] 是否是红黑树，如果是红黑树，则直接在树中插入键值对，
  否则转向⑤；
⑤.遍历 table[i]，判断链表长度是否大于 8，大于 8 的话把链表转换为红黑树，在红黑树中执行插入操作，
  否则进行链表的插入操作；遍历过程中若发现 key 已经存在直接覆盖 value 即可；
⑥.插入成功后，判断实际存在的键值对数量 size 是否超多了最大容量 threshold，如果超过，进行扩容。

get方法
(1)HashMap 的查找方法是 get(),它通过计算指定 key 的哈希值后，调用内部方法 getNode()；
(2)这个 getNode() 方法就是根据哈希表元素个数与哈希值求模（使用的公式是 (n - 1) &hash）得到 key 所在的桶的头结点，如果头节点恰好是红黑树节点，就调用红黑树节点的 getTreeNode() 方法，否则就遍历链表节点。
(3)getTreeNode 方法使通过调用树形节点的 find()方法进行查找.
(4)由于之前添加时已经保证这个树是有序的，因此查找时基本就是折半查找，效率很高。
(5)这里和插入时一样，如果对比节点的哈希值和要查找的哈希值相等，就会判断 key 是否相
等，相等就直接返回；不相等就从子树中递归查找。

扩容机制：
当HashMap中的元素个数超过数组大小(数组总大小length,不是数组中个数size)loadFactor 时，就会进行数组扩容， loadFactor 的默认值(DEFAULT_LOAD_FACTOR)为0.75，这是一个折中的取值。也就是说，默认情况下，数组大小(DEFAULT_INITIAL_CAPACITY)为16，那么当HashMap中元素个数超过160.75=12（这个值就是代码中的threshold值，也叫做临界值）的时候，就把数组的大小扩展为 2*16=32，即扩大一倍，然后重新计算每个元素在数组中的位置。

当HashMap中的其中一个链的对象个数如果达到了8个，此时如果capacity没有达到64，那么HashMap会先扩容解决，如果已经达到了64，那么这个链会变成树，结点类型由Node变成TreeNode类型。当然，如果当映射关系被移除后，下次resize方法时判断树的结点个数低于6个，也会把树再转为链表。

负载因子：
 负载因子的大小决定了HashMap的数据密度。
 负载因子越大密度越大，发生碰撞的几率越高，数组中的链表越容易长,造成查询或插入时的比较次数增多，性能会下降。
 负载因子越小，就越容易触发扩容，数据密度也越小，意味着发生碰撞的几率越小，数组中的链表也就越短，查询和插入时比较的次数也越小，性能会更高。但是会浪费一定的内容空间。而且经常扩容也会影响性能，建议初始化预设大一点的空间。
 按照其他语言的参考及研究经验，会考虑将负载因子设置为0.7~0.75，此时平均检索长度接近于常数。

尘埃不入你眼眸

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
深入分析HashMap

一、传统HashMap的缺点(1)JDK 1.8 以前 HashMap 的实现是数组+链表，即使哈希函数取得再好，也很难达到元素百分百均匀分布。(2)当 HashMap 中有大量的元素都存放到同一个桶中时，这个桶下有一条长长的链表，这个时候 HashMap 就相当于一个单链表，假如单链表有 n 个元素，遍历的时间复杂度就是 O(n)，完全失去了它的优势。(3)针对这种情况，JDK 1.8 中引入了红黑树（查找时间复杂度为 O(logn)来优化这个问题。二、JDK1.8 中 HashMap 的数据结
复制链接

扫一扫