开篇
本文基于 jdk1.8 讲述 HashMap 的 hash 算法,但是不会详细介绍其他相关内容(比如用法,底层数据结构)。所以必须事先知晓下面几点:
- HashMap 的底层数据结构是数组,在数组的基础上再去考虑链表或者红黑树
- put 一个 key-value 时,会先计算出在数组中的索引位置,再考虑剩下的步骤
- 位运算操作(异或,与)
- java 运算符优先级
正文
HashMap 是基于 key-value 形式存放元素的,所使用的方法是 put(key, value)
。
1. HashMap 的 put 方法源码
// 再次强调这是 jdk1.8 源码
public V put(K key, V value) {
// 这里调用 putVal() 方法
// 传入的第一个参数:是根据 key 计算出的 hash 值
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 获取数组的长度
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 计算元素在数组中的索引位置
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
// 忽略部分代码
}
}
2. 从上面的源码中提取出两个代码片段
2.1 片段 1 - 计算 hash 值
static final int hash(Object key) {
int h;
return (key == null) ?
0 :
(h = key.hashCode()) ^ (h >>> 16);
}
- 如果 key 为 null,hash == 0
- 否则
- 先取出 key 的 hashCode 值,得到 h1
- 然后对 h1 右移 16 位,得到 h2
- 最后将 h1 和 h2 进行异或运算,得到最终的 hash 值
举个例子吧:
- 先获得 key 的 hashCode 值,得到 h1
1111 1111 1111 1111 1010 1010 1010 1010
- 对 h1 右移 16 位,得到 h2
0000 0000 0000 0000 1111 1111 1111 1111
- 最后将 h1 和 h2 进行异或运算
1111 111 1111 1111 0101 0101 0101 0101
图解 1
图解 2
结论如下:
1. 最终结果就是将 h1 的高 16 位 和低 16位进行了异或运算。
2. 达到的效果就是混合原始哈希码的高位和低位,以此来加大低位的随机性。
3. 顺带着,低 16 位可以同时拥有高 16 位的信息。
2.2 片段 2 - 计算元素在数组中的索引位置
i = (n - 1) & hash
如果让我们来做,通常会想到用下面取模的方式计算索引。
i = hash % n
其实,上面两种算法得到的结果是一样的(自行验证),就当这是一个数学公式吧。
【前提是 HashMap 的数组长度要取2的整次幂,这也说明了为什么 HashMap 的初始容量不能随便给】
但是两者相比而言,位运算的效率会更高,所以 HashMap 用了第一种算法。
总结
-
当 HashMap 的数组长度是 2 的整次幂时,
(n - 1) & hash
与hash % n
计算的结果是等价的,而后者是更容易想到的办法,前者是更有效率的办法。 -
HashMap 的 hash 算法(看起来分了好几步),其实就是把 hashCode 值的高 16 位 与 低 16 位进行了异或运算,目的就是增大随机性。