Java面试八股之HashSet内部是怎么工作的

  1. Java中HashSet内部是怎么工作的

Java 中的 HashSet 是一个实现了 Set 接口的无序、不允许重复元素的集合类。它的内部工作原理基于 HashMap 的实现,主要依赖以下几个关键要素:

哈希函数:

HashSet 通过将每个添加的元素传递给一个哈希函数(Object.hashCode())来计算其哈希码。哈希码是一个整数值,理论上应尽可能将不同元素均匀分布到一个足够大的哈希值空间中。

桶(Bucket):

HashMap( HashSet)内部维护了一个数组,被称为“桶”(bucket)。哈希码被用来确定元素应该放入数组中的哪个桶。通常,通过将哈希码与桶数组长度进行模运算(取余)得到索引,即 index = hashcode % arraySize。这样,相同哈希码的元素理论上会被映射到同一个桶上。

链表(或红黑树):

每个桶实际上是一个链表(在 Java 8 及之后版本,当桶内元素过多时会转换为红黑树)的头结点。当多个元素被哈希到同一个桶时,它们会在同一个桶内的链表中以节点的形式存储。每个节点除了存储元素本身,还包含指向下一个节点的引用,形成链表结构。

哈希冲突解决:

当两个元素哈希到同一个桶时,会发生哈希冲突。为确保集合中元素的唯一性,HashSet 会在添加元素时进一步调用元素的 equals() 方法来检查是否有等价(根据 equals() 判断相等)但哈希码相同的元素已经存在于链表中。如果有,则不添加新元素;如果没有,新元素将作为链表的新节点添加到桶中。

扩容机制:

随着元素数量的增长,为了维持合理的哈希性能,HashSet(通过内部的 HashMap)会动态调整桶数组的大小。当元素数量超过阈值(通常是负载因子乘以当前容量)时,会触发扩容操作。扩容会创建一个新的、更大的桶数组,并重新计算每个元素的哈希值以确定其在新数组中的位置。这一过程称为“rehashing”。

 如果大家需要视频版本的讲解,欢迎关注我的B站:

  • 10
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值