HashMap底层原理

HashMap底层原理

1. HashMap的数据结构

要了解hashmap首先要弄清楚他的结构。在java编程语言中最基本的数据结构有两种,数组和链表。
数组:查询速度快,可以根据索引查询;但插入和删除比较困难;
链表:查询速度慢,需要遍历整个链表,但插入和删除操作比较容易。
hashmap是数组和链表组成的,数据结构中又叫“链表散列”。

在这里插入图片描述

2. HashMap特点

① HashMap内部通过一个数组实现,数组中的每个元素又是一个链表,链表中存储了哈希值相同的键值对。

② HashMap中可以存储null键和null值,但要注意,当HashMap的key为null时,其哈希值为0。

③ HashMap是线程不安全的

④ 可以实现快速随机访问

⑤ 在 JDK 8 中,HashMap 在解决 hash 冲突时使用的是链地址法,即将 hash 值相同的键值对都放在同一个单向链表()中,链表节点的结构是 Entry,其中有三个重要的属性:key、value 和 next。当同一个桶(bucket)的链表长度大于阈值(threshold)(默认为 8)时,就会将链表转换为红黑树。因此,当链表的长度超过了阈值时,HashMap 会将链表转化为红黑树,以提高查找效率。

需要注意的是,在 JDK 8 之前的版本,HashMap 在解决 hash 冲突时都是采用链地址法,没有红黑树优化。从 JDK 8 开始,HashMap 对链表长度超过阈值的情况进行了优化,使得 HashMap 的性能得到了进一步提升。

问 : 为什么链表转换为红黑树,会提高查找速率

当哈希表中某个桶中的链表长度超过一定阈值时,链表转化为红黑树可以提高查找效率,这是因为红黑树在查找时的时间复杂度为 O(log n),而链表的查找时间复杂度为 O(n),当链表长度较大时,查找效率会受到较大影响。而红黑树作为一种自平衡二叉搜索树,其插入、删除和查找等操作的时间复杂度都是 O(log n),所以对于大的桶,将其转化为红黑树可以提高查找效率。

需要注意的是,链表转化为红黑树的条件是链表的长度超过了一个阈值,这个阈值是通过对哈希表的大小和负载因子进行计算得到的。当哈希表中元素数量增加时,桶的数量也会随之增加,这样就可以保证单个桶中的元素数量不会过多,因此转化为红黑树的情况并不会经常发生。

3. HashMap的Hash算法

HashMap 的 Hash 算法是基于哈希表的,它使用了对象的 hashCode() 方法来确定对象在哈希表中的位置。具体地,对于每个 key 值,HashMap 会调用 key 的 hashCode() 方法来计算一个哈希值,然后根据这个哈希值和哈希表的容量计算出这个 key 在哈希表中的位置。当两个或多个 key 的哈希值相同时,它们会被放在同一个桶(bucket)中,通过链表或红黑树来组织。

具体来说,HashMap 的 Hash 算法分为以下几个步骤:

  1. 调用 key 的 hashCode() 方法获取 key 的哈希值 h;
  2. 使用哈希函数将 h 转换成索引值 index,具体的哈希函数实现取决于 HashMap 实现的版本;
  3. 如果该索引位置为空,则直接将键值对存储在该位置;
  4. 如果该索引位置已经存在一个或多个键值对,则遍历链表或树,如果找到了与当前 key 相同的键值对,则更新对应的 value 值,否则将新的键值对添加到链表或树的末尾。

其中第二步是 Hash 算法的关键,它决定了 key 在哈希表中的位置。通常情况下,哈希函数的实现方式是将哈希值 h 和哈希表容量进行按位与(&)运算,得到的结果即为索引值 index。

3.1 Hash值的计算

在 HashMap 中,每个元素都有一个对应的哈希值,哈希值是通过哈希函数计算得到的。在 Java 中,对象的哈希值可以通过调用对象的 hashCode() 方法来获取。

在 HashMap 中,每个元素被存储在数组中,数组的下标由哈希值计算而来。计算数组下标的方法是:先将哈希值与数组长度减一做位与操作,再得到的结果即为数组下标。比如说,数组长度是默认长度 16,那么数组下标可以通过 hash & 15 计算得到,其中 & 是位与运算符。

为了减少哈希冲突,HashMap 会使用一个称为“链表”的数据结构来存储哈希值相同的元素。当链表长度超过一定的阈值时,HashMap 会将链表转换为另一个称为“红黑树”的数据结构,以提高元素的访问效率。

为了保证哈希值能够足够随机,HashMap 会对哈希值进行一系列操作。其中,最重要的是将哈希值右移 16 位后与原哈希值进行异或操作。这样可以确保计算得到的哈希值分散性较好,不容易发生哈希冲突。

具体的计算公式如下:

hash = hashcode ^ (hashcode >>> 16)

那就是:
数组下标:hash&(16-1) = hash%16

3.2 Hash冲突

不同的键(对象)算出来的数组下标是相同的这样就会产生hash冲突。

如何解决哈希冲突
① 采用链表法(Chaining)

当哈希函数计算得到的哈希值相同,也就是发生哈希冲突时,会将冲突的键值对存储在同一个槽位上,并用一个链表将它们连接起来,形成一个单链表。这个单链表通常被称为“桶”(Bucket)。

弊端:

当哈希冲突比较严重时,链表会变得很长,这会降低哈希表的效率和性能

那么在jdk1.8以后的话,加入了红黑树,也就是说当链表达到一定长度后就会变成一个红黑树

下面我们再来讲下 红黑树

红黑树是一种自平衡二叉搜索树,它在插入和删除节点时可以自动地进行调整,使得整棵树始终保持平衡,从而保证了它的查找、插入、删除等操作的时间复杂度都为O(logn)。

  • 红黑树的每个节点都被标记为红色或黑色,它满足以下性质:

    1. 每个节点都是红色或黑色;

    2. 根节点是黑色;

    3. 每个叶子节点都是黑色的空节点(NIL节点);

    4. 如果一个节点是红色的,则它的两个子节点都是黑色的;

    5. 对于任意一个节点,从该节点到其所有后代叶子节点的简单路径上,均包含相同数目的黑色节点,这个数目被称为这个节点的黑色高度。

由于这些性质的限制,红黑树可以保证它的高度最多是2log(n+1),从而保证了它的操作效率。在插入和删除节点时,如果违反了红黑树的性质,就需要进行旋转和重新着色来进行调整,从而保持树的平衡。

  • 具体来说,插入节点时需要进行以下步骤:

    1. 将新节点插入到红黑树中,以红色标记;

    2. 检查是否需要进行旋转或重新着色,以保持红黑树的性质。

  • 删除节点时需要进行以下步骤:

    1. 删除节点,并将其替换为其后继节点;

    2. 检查是否需要进行旋转或重新着色,以保持红黑树的性质。

通过这些操作,红黑树可以保持自平衡,从而提高了其操作的效率和稳定性。在Java中,例如TreeMap和TreeSet就是基于红黑树实现的。

问:那在什么情况下链表会转化成红黑树 ?

答:在Java中,当HashMap中的某个桶(Bucket)中链表长度超过了阈值(默认为8),且当前 HashMap的元素数量大于等于64时,该桶中的链表就会被转化成红黑树。

在链表长度大于8的时候,将后面的数据存在二叉树中

② 采用 开放地址法(Open Addressing)

开放地址法(Open Addressing)是一种哈希冲突处理方法,与链表法不同,它不需要使用链表来存储冲突的元素。

当一个元素需要插入哈希表时,如果它的哈希值所对应的槽位已经被占用了,那么开放地址法会尝试在其他槽位中寻找空闲的位置,直到找到一个空闲的槽位为止,然后将该元素插入到这个槽位中。

弊端:

  1. 它需要在哈希表中寻找空闲的槽位来插入元素,这可能会导致哈希表的查找和插入操作的时间复杂度变得比较高。
  2. 当哈希表中的元素越来越多时,开放地址法容易发生聚集现象,也就是在哈希表中形成一个或多个长的空隙,从而导致哈希表的性能下降。

4. HashMap 扩容

① 那在什么情况下需要进行扩容呢?

如果当前HashMap中的元素数量已经达到了负载因子(默认为0.75)乘以数组大小,那么就需要对数组进行扩容。

比如说hashmap默认数组长度是16,那么达到出发条件,数组存储比例达到了75% ,也就是16*0.75=12的时候就会发生扩容

扩容的过程分为以下几个步骤:

  1. 创建一个新的数组,它的大小是原数组的两倍。
  2. 将原数组中的元素重新哈希并添加到新数组中。为了实现这个操作,HashMap会先遍历原数组,对每个非空的槽位中的元素进行重新哈希操作,并计算它们在新数组中的槽位位置,然后将它们添加到新数组的相应槽位中。
  3. 将原数组的引用指向新数组,这样原数组就成为了垃圾数据,等待Java垃圾回收器回收。

需要注意的是,扩容的过程是比较耗费时间和资源的,因此,在并发环境下,需要注意HashMap的线程安全性,并且可以通过使用ConcurrentHashMap等并发哈希表来提高并发性能。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值