JDK8_HashMap PUT和RESIZE操作

最新推荐文章于 2022-07-27 14:17:10 发布

马各阿牛

最新推荐文章于 2022-07-27 14:17:10 发布

阅读量313

点赞数 1

分类专栏： java HashMap 文章标签： java

本文链接：https://blog.csdn.net/weianluo/article/details/112695867

版权

java 同时被 2 个专栏收录

61 篇文章 0 订阅

订阅专栏

HashMap

1 篇文章 0 订阅

订阅专栏

现在一般面试中都会问到Jdk1.8的HashMap，里面的细节确实是魔鬼，今天这篇文章结合源码好好分析1.8中hashmap

本文只介绍Jdk1.8 HashMap源码较1.7 升级的其中两个部分，分别是put和resize两个操作

1. put操作

源码

    /**
     * Implements Map.put and related methods.
     *
     * @param hash hash for key
     * @param key the key
     * @param value the value to put
     * @param onlyIfAbsent if true, don't change existing value
     * @param evict if false, the table is in creation mode.
     * @return previous value, or null if none
     */
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //步骤①：如果Table为空，初始化一个Table
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;

        //步骤②：如果该bucket位置没值，则直接存储到该bucket位置，用&来代替%
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            
            //步骤③：如果节点key存在，直接覆盖value
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            //步骤④：如果该bucket位置数据是TreeNode类型，则将新数据添加到红黑树中。
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {  //步骤⑤：如果该链为链表
                for (int binCount = 0; ; ++binCount) {
                    //添加到链表尾部
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);          //如果链表个数达到8个，且数组长度大于等于64，将链表修改为红黑树结构
                        break;
                    }
                    // key已经存在直接覆盖value
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }

            //更新键值，并返回旧值
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        //步骤⑥：存储的数目超过最大容量阈值，就扩容
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

总结： put操作

1. 如果table数组为空，初始化一个数组（所以hashmap使用懒加载的方式）

2. p = tab[i = (n - 1) & hash]) == null，如果这个桶还没有Node元素，新插入一个Node

3. 如果当前桶已经存在Node，分以下两种情况：

a. 当前是链表

如果当前key值节点存在，则直接更新value，如果当前key值节点不存在，则在链表末尾插入一个新节点。如果链表长度大于等于8，且数组长度大于等于64，转换成红黑树（如果数组长度小于64，直接resize）

b. 当前是红黑树

如果当前key值节点存在，则直接更新value，如果当前key值节点不存在，则在红黑树插入一个新的节点。

2. resize 操作

只列举与本文有关的关键代码

if (loTail != null) {
   loTail.next = null;
   //这里很重要，新的位置为原老所处的位置，为什么扩容之后的位置还是原数组位置呢？下面解释
   newTab[j] = loHead;
}
if (hiTail != null) {
   hiTail.next = null;
   //这里很重要，新的位置为原老所处的位置+原数组的长度，为什么是这个值呢？下面解释
   newTab[j + oldCap] = hiHead;  
}

理解上文代码需要对JDK7里面的HashMap扩容方法有一定的了解，本文就不展开了。

看不懂没关系，只需要注意newTab[j] = loHead和newTab[j + oldCap] = hiHead这两行代码，其中newTab为新的数组，j为元素在原数组中的下标，oldCap为原数组的长度，loHead和hiHead都为元素。那么这两行的代码的意思就是说：

经过rehash之后，元素的位置要么是在原位置，要么是在原位置加原数组长度的位置。

那么为什么是这样的呢？这一步，是一个非常巧妙的地方，也是本文分析的重点。

解释：为什么经过rehash之后，元素的位置要么是在原位置，要么是在原位置加原数组长度的位置？

要搞明白这个问题首先要清楚

HashMap的数组长度恒定为2的n次方，也就是说只会为16，32，64，128这种数。源码中有限制，也就是说即使你创建HashMap的时候是写的

Map<String,String> hashMap = new HashMap<>(13);

最后数组长度也会变成16，而不是你的13. 会取与你传入的数最近的一个2的n次方的数。

static final int tableSizeFor(int cap) {
    int n = cap - 1;
    n |= n >>> 1;
    n |= n >>> 2;
    n |= n >>> 4;
    n |= n >>> 8;
    n |= n >>> 16;
    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

上面代码的意思是，把你所在入参cap的右边全部变成1，然后加1，如果传入是13，则输出16，如果传入是16，则输出16

那么明确这一点有什么用呢？HashMap中运算数组的位置使用的是leng-1，

那么就是对于初始长度为16的数组，扩容之后为32，对应的leng-1就是15，31，他们所对应的二进制为

15：0000 0000 0000 0000 0000 0000 0000 1111
31：0000 0000 0000 0000 0000 0000 0001 1111

n为table的长度，图（a）表示扩容前的key1和key2两种key确定索引位置的示例，图（b）表示扩容后key1和key2两种key确定索引位置的示例，其中hash1是key1对应的哈希与高位运算结果。

元素在重新计算hash之后，因为n变为2倍，那么n-1的mask范围在高位多1bit(红色)，因此新的index就会发生这样的变化：

因此，我们在扩充HashMap的时候，不需要像JDK1.7的实现那样重新计算hash，只需要看看原来的hash值新增的那个bit是1还是0就好了，是0的话索引没变，是1的话索引变成“原索引+oldCap”，可以看看下图为16扩充为32的resize示意图：

这个设计确实非常的巧妙，既省去了重新计算hash值的时间，而且同时，由于新增的1bit是0还是1可以认为是随机的，因此resize的过程，均匀的把之前的冲突的节点分散到新的bucket了。这一块就是JDK1.8新增的优化点。有一点注意区别，JDK1.7中rehash的时候，旧链表迁移新链表的时候，如果在新表的数组索引位置相同，则链表元素会倒置，但是从上图可以看出，JDK1.8不会倒置。

以下是resize源码

        if (oldTab != null) {
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                    oldTab[j] = null;
                    if (e.next == null)
                        newTab[e.hash & (newCap - 1)] = e;
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    else { // preserve order
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }

我们重点看链表的resize，Node<K,V> loHead = null, loTail = null; Node<K,V> hiHead = null, hiTail = null;

代码把某一个桶的链表分成了两部分，一部分是loHead, 一部分是hiHead, loHead链表放在原来j的位置， hiHead链表放在原来位置j + oldCap的位置

红黑树部分的resize

源码如下

final void split(HashMap<K,V> map, Node<K,V>[] tab, int index, int bit) {
            TreeNode<K,V> b = this;
            // Relink into lo and hi lists, preserving order
            TreeNode<K,V> loHead = null, loTail = null;
            TreeNode<K,V> hiHead = null, hiTail = null;
            int lc = 0, hc = 0;
            for (TreeNode<K,V> e = b, next; e != null; e = next) {
                next = (TreeNode<K,V>)e.next;
                e.next = null;
                if ((e.hash & bit) == 0) {
                    if ((e.prev = loTail) == null)
                        loHead = e;
                    else
                        loTail.next = e;
                    loTail = e;
                    ++lc;
                }
                else {
                    if ((e.prev = hiTail) == null)
                        hiHead = e;
                    else
                        hiTail.next = e;
                    hiTail = e;
                    ++hc;
                }
            }

            if (loHead != null) {
                if (lc <= UNTREEIFY_THRESHOLD)
                    tab[index] = loHead.untreeify(map);
                else {
                    tab[index] = loHead;
                    if (hiHead != null) // (else is already treeified)
                        loHead.treeify(tab);
                }
            }
            if (hiHead != null) {
                if (hc <= UNTREEIFY_THRESHOLD)
                    tab[index + bit] = hiHead.untreeify(map);
                else {
                    tab[index + bit] = hiHead;
                    if (loHead != null)
                        hiHead.treeify(tab);
                }
            }
        }

思路也跟链表的resize一样，分成hiHead和loHead

参考文档：

1. JDK1.8 源码

2. https://tech.meituan.com/2016/06/24/java-hashmap.html