Java HashMap 分析之三:放入元素

最新推荐文章于 2021-02-25 16:44:41 发布

Magister_Feng

最新推荐文章于 2021-02-25 16:44:41 发布

阅读量721

点赞数

分类专栏： java 文章标签： hashmap java 算法 table jdk null

本文链接：https://blog.csdn.net/Magister_Feng/article/details/7449096

版权

java 专栏收录该内容

38 篇文章 0 订阅

订阅专栏

现在，有了hash code,来考虑如何计算放入数组的位置。hash code值通常会很大，但是数组的大小有限，默认只有16，大的也不能超过2的30次方。所以，用模运算来保证在数组大小范围内是合理的，比如:index = hash code% array size.不过这有点慢，JDK采用了更快的算法。这个更快的算法源于一个数学规律，就是如果size是2的N次方，那么数X对size的模运算结果等价于X和size-1的按位与运算，也就是 X % size <=> X & (size -1).按位与只消耗一个CPU周期，当然快多了。现在就可理解为什么要故意把数组大小弄成2的N次方了。再回头看一开始计算数组大小的代码，完全理解了。

[java] view plain copy print ?

1. int capacity = 1;

2. while (capacity < initialCapacity)

3. capacity <<= 1;

比如size=16，二进制表示如下：（32位）
0000000000000000000000000010000
size-1=15，表示如下：
0000000000000000000000000001111

假如hash code=4
0000000000000000000000000000100
4 & 15 结果为：
0000000000000000000000000000100

假如hash code=6
0000000000000000000000000000101
6 & 15 结果为：
0000000000000000000000000000101

假如hash code=38
0000000000000000000000000100110
38 & 15 结果为：
0000000000000000000000000000110

通过观察这三个例子，又可以发现一个特点，也就是X & size-1 的结果受到了size的阶数的限制，这里size=16,阶数为4.结果就是只用低4位的1和X按位与，而X的高位没有用到。这会导致重复率相当高。如果用一个算法将X的低位重新计算，比如根据所有位的值进行重新计算，就可以使得hash值分布更均匀。下面的代码揭示了在真正按位与之前，调用了hash函数，进行了一堆位运算。至于为什么用这个算法，我也不知道其来历。