为了让大家一眼明白。
1、为什么初始容量是16
index = HashCode(Key) & (Length - 1)
如何进行位运算呢?有如下的公式(Length是HashMap的长度):
index = HashCode(Key) & (Length - 1)
下面我们以值为“book”的Key来演示整个过程:
1.计算book的hashcode,结果为十进制的3029737,二进制的101110001110101110 1001。
2.假定HashMap长度是默认的16,计算Length-1的结果为十进制的15,二进制的1111。
3.把以上两个结果做与运算,101110001110101110 1001 & 1111 = 1001,十进制是9,所以 index=9。
可以说,Hash算法最终得到的index结果,完全取决于Key的Hashcode值的最后几位。
Hash算法均匀分布
反观长度16或者其他2的幂,Length-1的值是所有二进制位全为1,这种情况下,index的结果等同于HashCode后几位的值。只要输入的HashCode本身分布均匀,Hash算法的结果就是均匀的。
因为2的幂次方拥有更低的碰撞几率和更高的查询速率。这才是他想考你的吧。
散列函数的设计就是围绕减少散列碰撞和使元素分布均匀(整个数组都能存放)而设计的。
HashMap就是一个插入慢、查询快的数据结构
1、如果空间利用率高,那么经过哈希计算后,发现很多位置满了
2、为了避免哈希冲突,增加数组容量,就会导致空间利用率不高。
加载因子,就是hash表中,元素的填满程度。
加载因子 = 填入表中的元素个数 / 散列表的长度
冲突的机会”与“空间利用率”之间,寻找一种平衡与折衷