现在一般面试中都会问到Jdk1.8的HashMap,里面的细节确实是魔鬼, 今天这篇文章结合源码好好分析1.8中hashmap
本文只介绍Jdk1.8 HashMap源码较1.7 升级的其中两个部分, 分别是put和resize两个操作
1. put操作
源码
/**
* Implements Map.put and related methods.
*
* @param hash hash for key
* @param key the key
* @param value the value to put
* @param onlyIfAbsent if true, don't change existing value
* @param evict if false, the table is in creation mode.
* @return previous value, or null if none
*/
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//步骤①:如果Table为空,初始化一个Table
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//步骤②:如果该bucket位置没值,则直接存储到该bucket位置,用&来代替%
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
//步骤③:如果节点key存在,直接覆盖value
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//步骤④:如果该bucket位置数据是TreeNode类型,则将新数据添加到红黑树中。
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else { //步骤⑤:如果该链为链表
for (int binCount = 0; ; ++binCount) {
//添加到链表尾部
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash); //如果链表个数达到8个,且数组长度大于等于64,将链表修改为红黑树结构
break;
}
// key已经存在直接覆盖value
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//更新键值,并返回旧值
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//步骤⑥:存储的数目超过最大容量阈值,就扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
总结: put操作
1. 如果table数组为空, 初始化一个数组 (所以hashmap使用懒加载的方式)
2. p = tab[i = (n - 1) & hash]) == null, 如果这个桶还没有Node元素, 新插入一个Node
3. 如果当前桶已经存在Node, 分以下两种情况:
a. 当前是链表
如果当前key值节点存在,则直接更新value, 如果当前key值节点不存在,则在链表末尾插入一个新节点。 如果链表长度大于等于8,且数组长度大于等于64, 转换成红黑树(如果数组长度小于64, 直接resize)
b. 当前是红黑树
如果当前key值节点存在,则直接更新value,如果当前key值节点不存在,则在红黑树插入一个新的节点。
2. resize 操作
只列举与本文有关的关键代码
if (loTail != null) {
loTail.next = null;
//这里很重要,新的位置为原老所处的位置,为什么扩容之后的位置还是原数组位置呢?下面解释
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
//这里很重要,新的位置为原老所处的位置+原数组的长度,为什么是这个值呢?下面解释
newTab[j + oldCap] = hiHead;
}
理解上文代码需要对JDK7里面的HashMap扩容方法有一定的了解,本文就不展开了。
看不懂没关系,只需要注意newTab[j] = loHead
和newTab[j + oldCap] = hiHead
这两行代码,其中newTab
为新的数组,j
为元素在原数组中的下标,oldCap
为原数组的长度,loHead和hiHead都为元素。那么这两行的代码的意思就是说:
经过rehash之后,元素的位置要么是在原位置,要么是在原位置加原数组长度的位置。
那么为什么是这样的呢?这一步,是一个非常巧妙的地方,也是本文分析的重点。
解释:为什么经过rehash之后,元素的位置要么是在原位置,要么是在原位置加原数组长度的位置?
要搞明白这个问题首先要清楚
HashMap的数组长度恒定为2的n次方,也就是说只会为16,32,64,128这种数。源码中有限制,也就是说即使你创建HashMap的时候是写的
Map<String,String> hashMap = new HashMap<>(13);
最后数组长度也会变成16,而不是你的13. 会取与你传入的数最近的一个2的n次方的数。
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
上面代码的意思是,把你所在入参cap的右边全部变成1, 然后加1, 如果传入是13,则输出16, 如果传入是16, 则输出16
那么明确这一点有什么用呢?HashMap中运算数组的位置使用的是leng-1,
那么就是对于初始长度为16的数组,扩容之后为32,对应的leng-1就是15,31,他们所对应的二进制为
15:0000 0000 0000 0000 0000 0000 0000 1111
31:0000 0000 0000 0000 0000 0000 0001 1111
n为table的长度,图(a)表示扩容前的key1和key2两种key确定索引位置的示例,图(b)表示扩容后key1和key2两种key确定索引位置的示例,其中hash1是key1对应的哈希与高位运算结果。
元素在重新计算hash之后,因为n变为2倍,那么n-1的mask范围在高位多1bit(红色),因此新的index就会发生这样的变化:
因此,我们在扩充HashMap的时候,不需要像JDK1.7的实现那样重新计算hash,只需要看看原来的hash值新增的那个bit是1还是0就好了,是0的话索引没变,是1的话索引变成“原索引+oldCap”,可以看看下图为16扩充为32的resize示意图:
这个设计确实非常的巧妙,既省去了重新计算hash值的时间,而且同时,由于新增的1bit是0还是1可以认为是随机的,因此resize的过程,均匀的把之前的冲突的节点分散到新的bucket了。这一块就是JDK1.8新增的优化点。有一点注意区别,JDK1.7中rehash的时候,旧链表迁移新链表的时候,如果在新表的数组索引位置相同,则链表元素会倒置,但是从上图可以看出,JDK1.8不会倒置。
以下是resize源码
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
我们重点看链表的resize,Node<K,V> loHead = null, loTail = null; Node<K,V> hiHead = null, hiTail = null;
代码把某一个桶的链表分成了两部分,一部分是loHead, 一部分是hiHead, loHead链表放在原来j的位置, hiHead链表放在原来位置j + oldCap的位置
红黑树部分的resize
源码如下
final void split(HashMap<K,V> map, Node<K,V>[] tab, int index, int bit) {
TreeNode<K,V> b = this;
// Relink into lo and hi lists, preserving order
TreeNode<K,V> loHead = null, loTail = null;
TreeNode<K,V> hiHead = null, hiTail = null;
int lc = 0, hc = 0;
for (TreeNode<K,V> e = b, next; e != null; e = next) {
next = (TreeNode<K,V>)e.next;
e.next = null;
if ((e.hash & bit) == 0) {
if ((e.prev = loTail) == null)
loHead = e;
else
loTail.next = e;
loTail = e;
++lc;
}
else {
if ((e.prev = hiTail) == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
++hc;
}
}
if (loHead != null) {
if (lc <= UNTREEIFY_THRESHOLD)
tab[index] = loHead.untreeify(map);
else {
tab[index] = loHead;
if (hiHead != null) // (else is already treeified)
loHead.treeify(tab);
}
}
if (hiHead != null) {
if (hc <= UNTREEIFY_THRESHOLD)
tab[index + bit] = hiHead.untreeify(map);
else {
tab[index + bit] = hiHead;
if (loHead != null)
hiHead.treeify(tab);
}
}
}
思路也跟链表的resize一样, 分成hiHead和loHead
参考文档:
1. JDK1.8 源码
2. https://tech.meituan.com/2016/06/24/java-hashmap.html