集合是 Java 开发中使用频率非常高的,而其中HashMap更是经常使用的一种集合类型。其实现Map接口,是一种K-V结构的数据集合,底层是由数组加链表形式组成的。这一系列主要从源码上去了解并学习分析HashMap,JDK版本为1.8。
本次主要分析一个问题,为什么HashMap的容量是2的n次幂?
首先需要了解的是HashMap的机构,其K-V结构是个数组加链表形式,key通过hash运算确定数组的位置,key-value则存储在数组对应的链表中。如下图所示:
由此可见,hash运算确定数组位置就非常关键。hash是一串数字,而将数字分布到数组中,一般就会想到取模。实际上java源码就是这么做的,通过hash值的取模确定数组中位置。
通常我们取模运算如何进行呢?这个太简单了,就是a = b % c嘛。那我们现在回头去看看JDK源码中是如何实现的。
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
可以看出,定位数组位置的时候为 tab[i = (n - 1) & hash],即index=(length - 1) & hash。
那么,为什么可以使用位运算(&)来实现取模运算(%)呢?这实现的原理如下:
X % 2^n = X & (2^n - 1)
2^n 表示 2 的 n 次方,也就是说,一个数对 2^n 取模 == 一个数和(2^n - 1)做按位与运算 。
假设 n 为 3,则 2^3 = 8,表示成 2 进制就是 1000。2^3 -1 = 7 ,即 0111。
此时 X & (2^3 - 1) 就相当于取 X 的 2 进制的最后三位数。
从 2 进制角度来看,X / 8 相当于 X >> 3,即把 X 右移 3 位,此时得到了 X / 8 的商,而被移掉的部分(后三位),则是 X % 8,也就是余数。
比如:6 % 8 = 6 ,6 & 7 = 6 ;10 % 8 = 2 ,10 & 7 = 2
所以,return h & (length-1),只要保证 length 的长度是 2^n 的话,就可以实现取模运算了。而HashMap中的 length 也确实是2的倍数,初始值是 16,之后每次扩充为原来的 2 倍。下一篇中会分析如何确保length是2的倍数的。
最后可能会问,既然取模就可以定位了,为什么要用这种方式((length - 1) & hash)呢?这是因为计算机的运算方式决定的,按位与运算的效率比取模运算要高得多,所以HashMap的源码设计是为了实现更高的效率。日常编码的时候也可以源码里借鉴一些解决问题的思路。