分析HashMap1.7中的hash方法

    static int hash(int h) {
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

我们知道,对于HashMap的table而言,数据的分布要均匀(最好下标只有一个元素,这样可以直接找到)不能太紧,也不能太松。太紧导致查询速度慢,太松则浪费空间。计算hash值后,如何保证table的元素均匀分布呢?HashMap使用indexFor方法

    static int indexFor(int h, int length) {
        return h & (length-1);
    }

hashMap底层数组的长度为2的n次方,在构造函数中: capacity <<=1;这样总能保证HashMap底层数组的长度为2的n次方。当length为2的n次方时,h & (length - 1)就相当于对length取模,而且速度要快。并且能均匀分布table数据和充分利用空间。

假设length 为16 (2^n)和15,h为5,6,7

table1_thumb[3]

当length = 15时, h为6 ,7会产生碰撞。这样6,7就会在这个角标为6的位置上创建一个链表。这样会导致查询速度降低。我们看看h为0-15时的结果。

table2_thumb[16]

可以看到,发生了8次碰撞,同时空间浪费严重。1.3.5.7.9.11.13.15处没记录。原因在于在与14进行&运算时,得到的最后一位永远都是0,即000.,0011,0101,0111,1001,1011,1101,1111处不可能存储数据。空间减少,碰撞加大。

所以当length为2^n时,不同的hash值发生的碰撞的概率比较小。这样会使得数据在table数组中分布较均匀,查询速度也快。

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HashMap1.7 的底层实现原理主要基于数组和链表实现的,具体如下: 1. 数组:HashMap1.7 底层采用数组来存储数据,数组的长度是固定的,并且必须是2的幂次方,这是因为在计元素在数组的位置时,采用的是位运,而2的幂次方可以使用位运来代替取模运,从而提高计效率。 2. 链表:当多个元素的 hashcode 值相同时,它们会被存储在同一个数组位置上,这时就会形成一个链表来存储这些元素。在 HashMap1.7 ,采用的是单向链表,每个节点包含了 key、value 和指向下一个节点的指针。同时,每个数组位置上都有一个指向链表头部的指针,用来方便查找和添加元素。 3. hash 函数:HashMap1.7 hash 函数采用了位运的方式,先将 key 的 hashcode 值与 (length - 1) 进行与运,得到的结果即为元素在数组的位置。这种方式可以有效地避免 hash 冲突,提高查找和添加元素的效率。 4. 扩容:当 HashMap1.7 元素的数量达到了负载因子(默认为0.75)乘以数组长度时,就会触发扩容操作。扩容时,会将数组长度扩大为原来的两倍,并重新计每个元素在数组的位置,将它们插入到新的数组。同时,由于原来的链表可能会被拆分成多个链表,所以需要重新组织链表结构,使得每个链表只包含一个位置上的元素。 综上所述,HashMap1.7 底层实现原理主要基于数组和链表实现的,采用了位运的方式来计元素在数组的位置,同时支持扩容操作,从而提高了查找和添加元素的效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值