分析HashMap1.7中的hash方法

最新推荐文章于 2022-04-30 22:04:33 发布

逆风飞翔的猪

最新推荐文章于 2022-04-30 22:04:33 发布

阅读量1.1k

点赞数

分类专栏： java

本文链接：https://blog.csdn.net/kekekeqi/article/details/85771822

版权

6 篇文章 0 订阅

订阅专栏

    static int hash(int h) {
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

我们知道，对于HashMap的table而言，数据的分布要均匀（最好下标只有一个元素，这样可以直接找到）不能太紧，也不能太松。太紧导致查询速度慢，太松则浪费空间。计算hash值后，如何保证table的元素均匀分布呢？HashMap使用indexFor方法

    static int indexFor(int h, int length) {
        return h & (length-1);
    }

hashMap底层数组的长度为2的n次方，在构造函数中: capacity <<=1;这样总能保证HashMap底层数组的长度为2的n次方。当length为2的n次方时，h & （length - 1）就相当于对length取模，而且速度要快。并且能均匀分布table数据和充分利用空间。

假设length 为16 （2^n）和15，h为5，6，7

table1_thumb[3]

当length = 15时， h为6 ，7会产生碰撞。这样6，7就会在这个角标为6的位置上创建一个链表。这样会导致查询速度降低。我们看看h为0-15时的结果。

table2_thumb[16]

可以看到，发生了8次碰撞，同时空间浪费严重。1.3.5.7.9.11.13.15处没记录。原因在于在与14进行&运算时，得到的最后一位永远都是0，即000.，0011，0101，0111，1001，1011，1101，1111处不可能存储数据。空间减少，碰撞加大。

所以当length为2^n时，不同的hash值发生的碰撞的概率比较小。这样会使得数据在table数组中分布较均匀，查询速度也快。

关注

专栏目录