1、如何得到数组的下标
> hash
此方法用计算元素的hash值的。简单分析:
- 如果 key是一个空, 此时他的 hash 为 0
- 如果不是空值
- 拿到它的 hashCode 赋给 H
- 并且 与自身的高16位相与计算
static final int hash(Object key) {
int h;
return key == null ? 0 : (h = key.hashCode()) ^ h >>> 16;
}
计算索引下标
得到 hash 值后 便是计算索引下标的步骤
p = tab[i = (n - 1) & hash])
如果map的长度是 length 那index的值就从 0 ~ length-1。所以index需要尽可能的平衡,也就是分布均匀,不能某些位置上存储特别多的数据,某些位置上又特别少。 解决办法:
- 取模计算
- hash值为int,index需要映射到0 ~ length -1,最直观的使用取模运算, index = hash值 % length
- 位运算
- (n - 1) & hash
肯定是位运算的效率比较高!!!注意此时 n -1 是一个奇数
举例
index = HashCode(Key) & (Length - 1)
以值为“book”的Key来演示整个过程:
-
计算book的hashcode,结果为十进制的3029737,二进制的101110001110101110 1001。
-
假定HashMap长度是默认的16,计算Length-1的结果为十进制的15,二进制的1111。
-
把以上两个结果做与运算,101110001110101110 1001 & 1111 = 1001,十进制是9,所以 index=9。
可以说,Hash算法最终得到的index结果,完全取决于Key的Hashcode值的最后几位。
长度16或者其他2的幂,Length-1的值是所有二进制位全为1,这种情况下,index的结果等同于HashCode后几位的值。只要输入的HashCode本身分布均匀,Hash算法的结果就是均匀的。