1. 前言
通过前面的文章,我们知道了什么是哈希表,Java的HashMap是什么、其底层的结构以及如何使用Java里面的HashMap。
总结一句话:HashMap是基于底层叫Entry[]数组实现的一种哈希表
那今天我们来稍微深入一点,讲解HashMap里面的一个点:存取(put/get)数据的时候,Entry数组index下标的计算。
1.1 hashCode,hash与index的概念
来回忆一下:
a).上一节讲到put/get一个元素的时候,会调用该元素的hashCode方法,比如下面的自定义KeyObject类。
b).hashCode的数据会被用来计算hash值
如果细心的小伙伴,去print一下这个hash值,就会发现其实是一个非常大的整数,比如2028737这样的,显然这个hash值不会是底层Entry[]数组的index值。
所以总结一下:
hashCode:HashMap的Key对象里面的方法hashCode产生的值hash:通过hashCode的值,通过一定算法产生的hash值index:通过hash值计算产生的,HashMap底层数组Entry[]的偏移值那计算index的方法是什么呢?
1.2 index的计算原则
Entry[]数组的长度在初始化的时候会被指定,假定这个值为length。
那index的值就从 0 ~ length-1。所以index需要尽可能的平衡,也就是分布均匀,不能某些位置上存储特别多的数据,某些位置上又特别少。
前面我们说过,通过hash值来计算index,那使用什么办法可以满足:
性能高效均匀分析1.3 index的计算方法
1.3.1 取模运算
hash值为int,index需要映射到0 ~ length -1,最直观的使用取模运算,也就是:
index = hash值 % length这个时候index的值的范围就是 0 ~ length -1
但是,Java 官方没有采用这个办法,因为这种效率不是最高的。
1.3.2 位运算(为什么长度一定是2的n次方)
为了解决取模效率的问题,Java官方采用了位运算的方法。
index = hash值 & (length -1)
这个时候,如果要index的值的范围也是 0 ~ length -1,需要一个前置条件:
length的长度必须是2的n次幂。当length的长度是2的n次方时,有以下的公式成立:
因为:一个数num除以2n,相当于右移n位,那么移出去的那些数自然就是余数了,举个例子158除以8:
1.3.3 性能比较
看到这里会有人问,为什么取模运算会比位运算慢,慢多少呢?我们来做个实验:
1.4 要点总结(常见问题)
如何计算index的为什么不用取模,要用位运算为什么长度一定是2的n次方