hash算法_JDK8 对 hash算法和寻址算法做了哪些优化?

前言

接着上篇文章《HashMap加载因子为什么是0.75?转化红黑树阈值为8? 》,咱们继续聊聊 HashMap 这个重要的数据结构。虽然它很简单,但是每一次读源码,我都有不同的体会,当然唯一不变的是对 Doug Lea 大神的崇拜。

在 JDK8 之后,对 HashMap 进行了重写,最显而易见的当然是引入了红黑树。由此而来,对它的哈希算法和寻址算法也做了一定的优化。

正文

寻址算法

在插入和查找数据的时候,我们会根据 key 得到它对应的 hash 值,然后再根据这个 hash 值进行一系列计算,得到元素在数组的下标位置,这个计算过程就是就是寻址算法。

final Node getNode(int hash, Object key) {        Node[] tab; Node first, e; int n; K k;        if ((tab = table) != null && (n = tab.length) > 0 &&            (first = tab[(n - 1) & hash]) != null) {            if (first.hash == hash && // always check first node                ((k = first.key) == key || (key != null && key.equals(k))))                return first;            if ((e = first.next) != null) {                if (first instanceof TreeNode)                    return ((TreeNode)first).getTreeNode(hash, key);                do {                    if (e.hash == hash &&                        ((k = e.key) == key || (key != null && key.equals(k))))                        return e;                } while ((e = e.next) != null);            }        }        return null;    }

其中最关键的是下面这一行,它展示了如何通过计算好的 hash 值来得到对应的哈希槽的位置:

first = tab[(n - 1) & hash])

大家第一个想法肯定是通过模运算来计算,因此引出了下面的问题

HashMap 中寻址算法为什么使用&(与运算),代替模运算?

我们知道了一个 key 的 hash 值,用这个hash值跟数组长度取模,就可以得到下标位置,其中 n 是数组的长度:

(n - 1) & hash

如果使用与运算,其实该算法的结果和模运算的结果是相同的。

但是,对于现代的处理器来说,除法和求余数(模运算)是最慢的动作。

根据数学公式:

a % b = (b-1) & a

当 b 是 2 的指数时,等式成立。大家应该记起来,HashMap 默认的长度一定是 2 的指数幂,所以这一个等式针对 HashMap 是永远成立的。通过与运算,提高了运算的效率。

哈希算法

static final int hash(Object key) {     int h;          return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);}复制代码

看完源代码,第一次肯定会被其中的异或运算和右移运算搞蒙,为什么要异或呢?为什么要移位?而且移位 16?

我们分析一下:

首先,假设有一种情况,如果数组长度 n=16,那么根据寻址算法,也就是哈希值 和 15 这个数进行与运算

对象 A 的 hashCode 为 1000 0100 0111 0001 0000 0111 1000 0000

n-1=15 0000 0000 0000 0000 0000 0000 0000 1111


对象 B 的 hashCode 为 0111 0111 0011 1000 1010 0001 0100 0000

n-1=15 0000 0000 0000 0000 0000 0000 0000 1111


我们会发现 A、B 和 15 这个数进行与运后,得出来的结果都是 0, 这样的散列结果太让人失望了。很明显不是一个好的散列算法。

但是如果我们将 hashCode 值右移 16 位,然后再进行异或运算(如果两个数不同,结果为1,相同为0),这样的话,就能避免我们上面的情况的发生。

对象A hashCode: 1000 0100 0111 0001 0000 0111 1000 0000

对象A hashCode右移16位: 0000 0000 0000 0000 1000 0100 0111 0001

异或运算: 1000 0100 0111 0001 1000 0011 1111 0001

n-1=15 0000 0000 0000 0000 0000 0000 0000 1111

与运算: 0000 0000 0000 0000 0000 0000 0000 0001


对象B hashCode: 0111 0111 0011 1000 1010 0001 0100 0000

对象B hashCode右移16位: 0000 0000 0000 0000 0111 0111 0011 1000

异或运算: 0111 0111 0011 1000 1101 0110 0100 1000

n-1=15 0000 0000 0000 0000 0000 0000 0000 1111

与运算: 0000 0000 0000 0000 0000 0000 0000 1000


通过结果可以看出来,这样异或运算得到结果,再和 n-1 与运算,得到结果不同,避免了 hash 冲突。

文末福利

找工作的小伙伴可以后台联系我,拉你进秋招/内推/面试群,我也给大家整理了各大公司的内推通道。

公号「程序员大帝」后台回复「666」就能得到我为大家整理的简历模板、大厂面试突击资料还有历年的笔试题,大家要好好准备哦。

还可以帮助大家免费修改简历、模拟面试哦~可能下期视频的主角就是你哦~

2eeb06a4b97efe74e74ff442db63a0c0.png

我是无忌,Stay Tuned!

83eec8adbcd74c79da4338040f953025.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: HashMap 是一种哈希表实现的映射。它存储键值对,允许用户快速查找特定键对应的值。 HashMap 底层是通过数组和链表实现的。它将键哈希成一个整数,然后将键值对存储在数组中的对应位置。如果多个键值对映射到了同一个数组位置,它们就会按照链表的形式连接起来。 在 JDK8 中,HashMap 了以下优化: 1. 当链表长度大于某个阈值(默认为 8)时,会自动转换为红黑树。这样可以使查询的时间复杂度从 O(n) 降低到 O(log n)。 2. 当哈希表中的实际大小(键值对数量)超过哈希表数组的大小时,会自动将哈希表数组的大小增加一倍。这样可以减少碰撞的次数,提高查询效率。 3. 引入了“红色哈希码”(fusing hash code)技术,可以通过一个状态位来标识一个节点是否被搬迁过。这样可以在查询时避免对节点的额外访问,提高查询效率。 ### 回答2: HashMap是一种常用的键值对存储结构,其底层实现原理是哈希表。具体而言,HashMap使用了一个数组和链表(或红黑树)的数据结构。当元素插入HashMap中时,会根据元素的哈希值计算出对应的索引位置,并将其插入到该索引位置对应的桶中。如果多个元素的哈希值相同,它们会通过链表(JDK8之前)或红黑树(JDK8之后)的形式存储在同一个桶中,以避免哈希冲突。 JDK8对HashMap进行了一些优化,以提高其性能和效率。其中包括以下几个方面: 1. 红黑树:JDK8在HashMap的实现中引入了红黑树的概念。当链表长度超过一定阈值(默认为8)时,链表会被转换为红黑树。这样可以大大提高在大型HashMap中进行查找、删除和插入操作的效率。 2. 数组扩容:JDK8在HashMap的数组扩容时,采用了一种更高效的方式。在JDK8之前,每次扩容都需要重新计算元素的哈希值并重新放置到新的数组中,而JDK8则通过利用元素的高位哈希值来加快定位。 3. 链表转换为红黑树的优化:在JDK8中,当链表长度小于阈值(默认为6)时,如果需要插入新元素,HashMap会优先在链表的末尾插入,而不会转换为红黑树。这样可以避免在链表长度较小的情况下浪费内存和时间。 总的来说,JDK8对HashMap进行了一些重要的优化,包括引入红黑树、改进数组扩容和链表转换为红黑树的策略等,以提高其性能和效率。 ### 回答3: HashMap 是一种常用的数据结构,它是基于哈希表实现的。底层实现原理是使用数组和链表(或红黑树)的组合来存储数据,通过哈希值的计算将数据映射到数组的索引位置,当发生哈希冲突时,会使用链表或红黑树来解决冲突。 在 JDK8 中,HashMap 了一些优化以提高性能和减少内存消耗。 1. 数组+链表+红黑树的存储结构:当链表长度超过一定阈值(默认为 8)时,链表会转换为红黑树,这样可以减少搜索时间复杂度。 2. 节点的存储方式优化:在 JDK8 之前,HashMap 中每个节点都是一个独立的对象,包含了 key、value、next 和 hash 等属性。在 JDK8 中,当链表转化为红黑树时,为了节省内存空间,仅使用红黑树节点存储键值对,减少了额外的存储消耗。 3. 红黑树的自平衡能力:JDK8 中的红黑树实现了更加高效的自平衡算法,能够快速调整树的结构,以维持树的平衡,提高查询、插入和删除操作的效率。 4. 增强了扩容机制:JDK8 在扩容时,不再像以前一样重新计算每个元素的哈希值和索引位置,而是利用高位运算,减少了哈希碰撞的可能性,提高了扩容时的效率。 5. 实现了红黑树节点的统一化:红黑树节点和链表节点使用相同的数据结构,这样可以减少代码的复杂性,提高了代码的维护性。 总之,JDK8 在 HashMap 的底层实现上了一些优化,包括使用红黑树代替链表来解决哈希冲突、优化节点的存储方式、增强扩容机制和提高红黑树的自平衡能力等,以提高HashMap的性能和减少内存消耗。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值