深入理解HashMap扩容机制(JDK8)

深入理解HashMap扩容机制(JDK8)

一、说明

上一篇文章《深入理解HashMap扩容机制(JDK7)》中讲解了JDK7关于扩容的说明,必须满足两个条件:
1、 存放新值的时候当前已有元素的个数必须大于等于阈值
2、 存放新值的时候当前存放数据发生hash碰撞(当前key计算的hash值换算出来的数组下标位置已经存在值)
这篇文章我们来聊聊JDK8中HashMap的扩容机制

二、Java8的扩容机制

Java8中扩容只需要满足一个条件:当前存放新值(注意不是替换已有元素位置时)的时候已有元素的个数大于等于阈值(已有元素等于阈值,下一个存放后必然触发扩容机制):
  (1)扩容一定是放入新值的时候,该新值不是替换以前位置的情况下(说明:put(“name”,“zhangsan”),而map里面原有数据<“name”,“lisi”>,则该存放过程就是替换一个原有值,而不是新增值,则不会扩容)
  (2)扩容发生在存放后,即是数据存放后(先存放后扩容),判断当前存入对象的个数,如果大于阈值则进行扩容。

三、背景知识

Java7中Hashmap底层采用的是Entry对数组,而每一个Entry对又向下延伸是一个链表,在链表上的每一个Entry对不仅存储着自己的key/value值,还存了一个当前对象的hash值和指向下一个地址的next Node节点。

Java8中的Hashmap底层结构有一定的变化,还是使用的数组,但是数组的对象以前是Entry对,现在换成了Node对象(可以理解是Entry对,结构一样,存储时也会存key/value键值对、当前对象的hash值和指向下一个地址的next Node节点),以前所有的Entry向下延伸都是链表,Java8变成链表和红黑树的组合,数据少量存入的时候优先还是链表,当链表长度大于8,且数组长度大于64的时候,链表就会转化成红黑树,所以你会看到Java8的Hashmap的数据存储是数组+链表+红黑树的组合,如果数组长度小于64则只有数组+链表,如果数组长度大于64,且某一个数组下标数据量大于8,那么该处即为红黑树。

Node类的源码

	static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        V value;
        Node<K,V> next;// 和JDK7中的Entry一样,都是通过next来构建单向链表

        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }
        // 下面省略该类的一些方法,主要是看上面的内部结构     

四、HashMap中的扩容相关源码

在JDK7中,当new Hashmap()的时候会对对象进行初始化,而JDK8中new Hashmap()并没有对对象进行初始化,而是在put()方法中通过判断对象是否为空,如果为空通过调用resize()来初始化对象。

	public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }
	/**
     * Implements Map.put and related methods
     *
     * @param hash key值计算传来的下标
     * @param key
     * @param value
     * @param onlyIfAbsent true只是在值为空的时候存储数据,false都存储数据
     * @param evict
     * @return 返回被覆盖的值,如果没有覆盖则返回null
     */
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        // 申明entry数组对象tab[]:当前Entry[]对象
        Node<K,V>[] tab;
        // 申明entry对象p:这里表示存放的单个节点
        Node<K,V> p;
        // n:为当前Entry对象长度      // i:为当前存放对象节点的位置下标
        int n, i;

        /**
         * 流程判断
         * 1、如果当前Node数组(tab)为空,则直接创建(通过resize()创建),并将当前创建后的长度设置给n
         * 2、如果要存放对象所在位置的Node节点为空,则直接将对象存放位置创建新Node,并将值直接存入
         * 3、存放的Node数组不为空,且存放的下标节点Node不为空(该Node节点为链表的首节点)
         *   1)比较链表的首节点存放的对象和当前存放对象是否为同一个对象,如果是则直接覆盖并将原来的值返回
         *   2)如果不是分两种情况
         *      (1)存储处节点为红黑树node结构,调用方法putTreeVal()直接将数据插入
         *      (2)不是红黑树,则表示为链表,则进行遍历
         *          A.如果在链表中不存在key相同的node节点,则直接将该值存入链表尾部的空节点,存入后检查当前存入位置是否已经大于链表的第8个位置
         *              a.如果大于,调用treeifyBin方法判断是扩容 还是 需要将该链表转红黑树(大于8且数组长度大于64则转红黑色,否则对数组进行扩容)
         *              b.当前存入位置链表长度没有大于8,则存入成功,结束循环操作。
         *          B.如果存入链表的下一个位置有值,且该key和存入对象“一样”,在for循环中直接break,将给key相同的node节点赋值给e,在外面做统一处理
         *          上面AB两种情况执行完成后,判断返回的原对象是否为空,如果不为空,则将原对象的原始value返回
         * 上面123三种情况下,如果没有覆盖原值,则表示新增存入数据,存储数据完成后,size+1,然后判断当前数据量是否大于阈值,
         * 如果大于阈值,则进行扩容。
         */
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                // 按照红黑树直接将数据存入
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {            // for循环中有两个if,如果没有key相同(第二个if没有break),那么表示遍历完了链表直接将值插入链表尾部(尾插法使用p.next=newNode())
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);//该方法判断是扩容还是需要将该链表转红黑树
                        break;
                    }            // 如果存入链表的下一个位置有值,且该key和存入对象“一样”,直接break,将给key相同的node节点赋值给e(在上一步if中已经赋值了),在外面做统一处理
                    if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                        break;            // 每遍历一次在第一个if((e=p.next) == null)中从头到尾将每一个Node()节点复制给e,然后再将e赋值给p,使得链表完成从头到尾的遍历过程
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        // 如果不是替换数据存入,而是新增位置存入后,则将map的size进行加1,然后判断容量是否超过阈值,超过则扩容
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

treeifyBin()方法判断是扩容还是将当前链表转红黑树

	/**
     * Replaces all linked nodes in bin at index for given hash unless
     * table is too small, in which case resizes instead.
     * 从指定hash位置处的链表nodes头部开始,全部替换成红黑树结构。
     * 除非整个数组对象(Map集合)数据量很小(数组长度小于64),该情况下则通过resize()对这个Map进行扩容,而代替将链表转红黑树的操作。
     */
    final void treeifyBin(HashMap.Node<K,V>[] tab, int hash) {
        int n, index; HashMap.Node<K,V> e;
        // 如果Map(数组)为空或者当前存入数据数组长度小于64便进行扩容
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            resize();
        // 如果数组长度大于64则将正在存入的该值所在的链表转化成红黑树
        else if ((e = tab[index = (n - 1) & hash]) != null) {
            HashMap.TreeNode<K,V> hd = null, tl = null;
            do {
                HashMap.TreeNode<K,V> p = replacementTreeNode(e, null);
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            if ((tab[index] = hd) != null)
                hd.treeify(tab);
        }
    }

五、总结

1、Java 8 在新增数据存入成功后进行扩容
2、扩容会发生在两种情况下(满足任意一种条件即发生扩容):

  • 当前存入数据大于阈值即发生扩容
  • 存入数据到某一条链表时,此时该链表数据个数大于8,且数组长度小于64即发生扩容

3、此外需要注意一点java7是在存入数据前进行判断是否扩容,而java8是在存入数据后再进行扩容的判断。

该文章来自于本人多年前发表于博客园的原创作品:《深入理解HashMap的扩容机制》,转载请注明出处。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值