HashMap底层原理

HashMap 底层实现原理

HashMap 的底层实现是基于数组和链表(或红黑树)的数据结构。在 HashMap 中,数据主要存储在一个数组中,数组的每个元素称为一个桶(bucket)。每个桶可以存储一个或多个键值对,如果多个键值对被存储在同一个桶中,它们被组织成一个链表(或红黑树)。

插入键值对
  1. 计算索引:当往 HashMap 中插入键值对时,首先会根据键的哈希值计算出一个索引,即确定该键值对应该存储在哪个桶中。
  2. 存储数据
    • 如果该桶为空,直接将键值对存储在该桶中。
    • 如果该桶不为空,需要进行链表(或红黑树)的操作,将键值对添加到链表(或红黑树)的末尾。
查找键值对
  1. 计算索引:根据键的哈希值计算出索引。
  2. 查找数据
    • 如果桶为空,则说明没有找到对应的键值对。
    • 如果桶不为空,则需要遍历链表(或红黑树)来查找指定的键值对。
链表转换为红黑树

当 HashMap 中某个桶的链表长度超过一定阈值时(默认是8),链表会转换为红黑树,以提高查找效率。这是因为红黑树的查找和插入操作的时间复杂度是 O(log⁡n)O(\log n)O(logn),而链表的时间复杂度是 O(n)O(n)O(n)。当红黑树中的元素数量变少时,红黑树会重新转换为链表。

扩容

当 HashMap 中存储的键值对数量超过了数组长度的75%时(默认负载因子为0.75),会进行扩容操作。扩容操作会新建一个更大的数组,并将原有数组中的元素重新计算索引后存储到新数组中。

HashMap 为什么引入链表和红黑树

  1. 引入链表:因为在 put() 操作时,会进行哈希值的计算,算出存储下标后,将元素放入对应位置。当多个元素要放在同一位置时就会出现哈希冲突,采用链表结构将冲突的元素存储在同一个链表中(链地址法)。

  2. 引入红黑树:当链表长度大于8时,链表的遍历查询速度较慢,所以引入红黑树,提高查找效率。

  3. 为什么不一开始就使用红黑树:因为红黑树相对链表的维护成本更大,插入新数据后,可能需要通过左旋、右旋、变色来保持平衡,维护成本过高。因此,在链表较短时,不适合使用红黑树。

红黑树的理解

红黑树是一种平衡二叉查找树,具有以下特性:

  1. 根节点是黑色。
  2. 每个节点是黑色或红色。
  3. 红色节点的子节点都是黑色(即红色节点不能连续)。
  4. 从任意节点到其叶子节点的所有路径都包含相同数量的黑色节点。

HashMap 扩容

什么时候会发生扩容?
  1. 元素个数超过 数组长度 * 负载因子 时。例如,默认情况下,数组长度为16,负载因子为0.75,当元素超过12个时会扩容。
  2. 链表长度大于8并且表长小于64时,也会扩容。
为什么不是满了才扩容?

因为当元素数量接近数组长度时,哈希冲突的概率会大大增加。因此,提前扩容可以减少冲突,提高性能。

  • 5
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值