HashMap的hash算法

最新推荐文章于 2024-08-16 16:09:08 发布

--所念皆星河--

最新推荐文章于 2024-08-16 16:09:08 发布

阅读量635

点赞数 1

分类专栏：笔记文章标签： hashmap hash

本文链接：https://blog.csdn.net/zhjzhj_/article/details/117442932

版权

笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

HashMap的hash算法

文章摘自：https://blog.csdn.net/a314774167/article/details/100110216

下面是获取put方法中,get方法中获取key的hash值的方法

//重新计算哈希值
static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);//key如果是null 新hashcode是0 否则 计算新的hashcode
}

思考：为什么要进行无符号右移16位呢？

首先：什么是无符号右移16位？

按二进制形式把所有的数字向右移动对应位数，低位移出(舍弃)，高位的空位补零

所以说原来的hashcode值的高16位，再进行异或操作时会和低16位遇见，目的就是让高16位参与到后续的&运算计算桶位中，减少hash冲突的发生，计算公式：(n - 1) & hash，比如说初始值16的情况下，n-1就是15,15的二进制是0000000000000000001111，如果进行&运算的话,高位都是0，相当于屏蔽了高位。如果我们不做刚才移位异或运算，那么在计算槽位时将丢失高区特征，但是细想当两个哈希码很接近时，那么这高区的一点点差异就可能导致一次哈希碰撞，所以这也是将性能做到极致的一种体现

使用异或的原因：

异或运算能更好的保留各部分的特征，如果采用&运算计算出来的值会向0靠拢，采用|运算计算出来的值会向1靠拢

为什么槽位数要使用2^n呢？

假如槽位用了17

hashcode参加&运算后被更多位的0屏蔽，计算结果只剩下两种0和16，这对于hashmap来说是一种灾难

最终目的还是为了让哈希后的结果更均匀的分部，减少哈希碰撞，提升hashmap的运行效率

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null) //重点是这一行讲key放在哪一个桶上面
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;

算出hash值之后,计算这个key落在哪一个桶上面,方法有2中,一种是&,一种是%,这两种方法都可行,但是效率不一样,请看下面的的测试(抄作业的测试),这个差的还是挺多的,尤其是在map发生扩容的时候,需要重新计算所有key的hash值放到新的hash桶上面,这个时候差别的更大了

,额外记录一点,如果你想取234对8的余数是多少,就可以使用 234&(8-1),余数为2,这个前提a想对b取余时,b必须是2^{n才能这样玩,还是上面讲过的2}n -1的二级制会全是1,这样,取余的时候,结果就是高位全是0,低位就可以保留下来,保留下来的低位就是余数了