关于HashMap的哈希碰撞、拉链法和key的哈希函数设计

系列文章
关于时间复杂度o(1), o(n), o(logn), o(nlogn)的理解

关于HashMap的哈希碰撞、拉链法和key的哈希函数设计

关于JVM内存模型和堆内存模型的理解

关于代理模式的理解

关于Mysql基本概念的理解

关于软件设计模式的理解


前言

关于HashMap的哈希碰撞、拉链法和key的哈希函数设计的相关理解。

一、哈希碰撞是一种什么情况?

哈希碰撞指的是不同的键通过哈希函数映射到了同一个数组索引位置上,导致数据存储冲突的情况。
在 Java 中,hashCode() 方法用于返回对象的哈希码,通常用于哈希表数据结构(比如 HashMap、HashSet 等)中确定对象的存储位置。然而,即使是一个良好设计的哈希算法,也无法完全避免碰撞。
默认情况下,hashCode() 方法返回的是一个 32 位的有符号整数(int 类型),因此哈希码的数量理论上是有符号 32 位整数的取值范围。32 位有符号整数的取值范围是从 -2^31 到 2^31 - 1,即从 -2,147,483,648 到 2,147,483,647。所以,32 位哈希码的数量是2^32,即约为 4.29 亿个不同的哈希码。
这意味着,理论上 Java 中可以有大约 4.29 亿个不同的哈希码。然而,由于对象的数量可能是无限的,因此哈希码的数量远远不够覆盖所有可能的对象,这就导致了哈希冲突的发生

二、拉链法为什么能用来解决HashMap中的哈希碰撞问题?

链地址法(也称为拉链法)通过在哈希表的每个桶(bucket)中维护一个链表或者其他形式的数据结构,将具有相同哈希值的键值对存储在同一个桶中,并通过链表等结构来解决冲突。

具体来说,当发生哈希碰撞时,HashMap会将具有相同哈希值的键值对存储在同一个桶中,而不是简单地覆盖原有的键值对。这样,每个桶中存储的数据形成了一个链表(或者其他形式的链式结构),在桶内查找时,只需要遍历该链表即可找到目标键值对。

链地址法解决了哈希碰撞问题,使得HashMap能够高效地存储大量数据,并且在平均情况下,哈希表的查询、插入和删除操作的时间复杂度都为O(1)。然而,在最坏情况下,所有的键都哈希到了同一个桶中,此时的时间复杂度可能会变为O(n),但这种情况发生的概率非常低,因此链地址法在实践中被广泛应用。

三、key的哈希函数设计

HashMap 使用了一个称为“扰动函数(mixing function)”的哈希函数来将键的哈希值映射到桶数组的索引位置。扰动函数的作用是将输入的哈希值“扰动”或“混淆”,使得输出的哈希值更加均匀地分布在桶数组的索引范围内,从而减少哈希碰撞的概率。

在 Java 的 HashMap 实现中,扰动函数的设计采用了以下步骤:

初始哈希值: 首先,获取键的哈希值,通常是通过调用键对象的 hashCode() 方法来获取。这个哈希值可能是任意长度的整数,它是由键对象的特征(比如内容、状态等)计算出来的。

扰动过程: 接下来,HashMap 会对初始哈希值进行一系列的位运算和异或操作来扰动哈希值。这个过程旨在增加哈希值的随机性,以减少哈希碰撞的概率。具体的扰动过程可能会包括位移、异或、乘法等操作,这取决于具体的实现。

取模操作: 最后,将扰动后的哈希值与桶数组的长度进行取模运算,以得到最终的索引位置。取模操作可以确保哈希值落在桶数组索引的合法范围内,从而将键均匀地分布到不同的桶中。

通过扰动函数的设计,HashMap 能够尽量均匀地将键映射到桶数组的索引位置,从而降低了哈希碰撞的概率。

代码如下(示例):


	static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }
    

1. h = key.hashCode():调用键对象的 hashCode() 方法,获取键的原始哈希值,并将其赋值给变量 h。

2. (h >>> 16):将 h 向右位移 16 位,相当于将原始哈希值的高位与低位进行了混合。

3. h ^ (h >>> 16):将原始哈希值和右移后的哈希值进行异或操作。这一步是扰动函数的关键,通过异或运算,将原始哈希值的高位和低位进行混合,增加了哈希值的随机性

这段代码实现了简单但有效的扰动函数,能够将键的哈希值均匀地映射到桶数组的索引位置,降低了哈希碰撞的概率,同时也保证了 HashMap 的性能。

  • 8
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值