HaspMap的数据结构是数组加单链表,把初始容量设置为2的幂有助于HashMap中的元素存放地更均匀,降低了hash碰撞的概率,提高了查找的效率和空间利用率。
最理想的情况是Entry数组中每一个位置都只存放一个元素,这样在查找的时候不用去遍历链表,这时候空间利用率最大,时间复杂度最优。
计算最均匀的是对length取模运算:哈希值%容量=bucketIndex(桶位)
/**
* Returns index for hash code h.
*/
// h为经过hashcode计算后得到的哈希值
//length为当前的容量
static int indexFor(int h, int length) {
//这里使用的是位运算符
return h & (length-1);
}
位运算符h&(length-1)可以实现一个均匀分布,当初始容量为2的整数次幂时,h & (length-1) 就等价于 h%length(对length取模),这时候元素在哈希表中能够更加均匀地散列。
另外:如果length为2的整数次幂时,也就是length为偶数,那么length-1为奇数,在位运算中奇数的最后一位为1,这样保证了在做h&(length-1)位运算后,最后一位有可能是0,也有可能是1(当h为0的时候是0,h为1的时候为1),这时候Key的hashcode经过hash函数散列后的哈希值在数组(桶中)的下标既可以的奇数也可以是偶数。当然如果length为奇数,那么length-1就为偶数,做h&(length-1)位运算后最后一位只能是0,也就是经过hash函数散列后的哈希值在数组中的下标只能是偶数,这样就浪费了近一半的空间。