HashMap学习篇put（）与resize（）的扩容机制（JDk1.8）

最新推荐文章于 2023-04-12 11:14:30 发布

Listener_code

最新推荐文章于 2023-04-12 11:14:30 发布

阅读量541

点赞数

分类专栏：多线程文章标签： java

本文链接：https://blog.csdn.net/Violet_201903027/article/details/106409492

版权

多线程专栏收录该内容

3 篇文章 0 订阅

订阅专栏

HashMap学习篇resize（）的扩容机制（JDk1.8）

数据丢失（在put时,例如：挂载数据到链表时，线程2覆盖线程1）
JDK1.7的死循环  扩容时，头插法弊端链表数据相互引用

先提一下HashMap的底层数据结构为数组+链表+红黑树。

put（）代码解析



    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }
    
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                       boolean evict) {
            Node<K,V>[] tab; Node<K,V> p; int n, i;
            //判断hashMap原容器是否初始化内存空间
            if ((tab = table) == null || (n = tab.length) == 0)
            //当判断能为空时，进行hashMap的扩容
                n = (tab = resize()).length;
            // 注意：(n - 1) & hash才是真正的hash值，也就是存储在table位置的index
            if ((p = tab[i = (n - 1) & hash]) == null)
            //如果没有保存，说明可以直接保存
                tab[i] = newNode(hash, key, value, null);
            else {
              //如果发现不是null说明，需要进行链表挂载  
                Node<K,V> e; K k;
                // 如果在首结点与我们待插入的元素有相同的hash和key值，则先记录。
                if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))
                    e = p;
                else if (p instanceof TreeNode)
                    // 如果首结点的类型是红黑树类型，则按照红黑树方法添加该元素
                    e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
                else {
                     // 到这一步，说明首结点类型为链表类型。
                    for (int binCount = 0; ; ++binCount) {
                         // 如果遍历到末尾时，先在尾部追加该元素结点。
                        if ((e = p.next) == null) {
                            p.next = newNode(hash, key, value, null);   
                            // 当遍历的结点数目大于8时，则采取树化结构。
                            if (binCount >= TREEIFY_THRESHOLD - 1) 
                                treeifyBin(tab, hash);
                            break;
                        }
                        if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))
                         // 如果找到与我们待插入的元素具有相同的hash和key值的结点，则停止遍历。此时e已经记录了该结点
                            break;
                        p = e;
                    }
                }
                 // 表明，记录到具有相同元素的结点
                if (e != null) { // existing mapping for key
                    V oldValue = e.value;
                    if (!onlyIfAbsent || oldValue == null)
                        e.value = value;
                    afterNodeAccess(e);
                    return oldValue;
                }
            }
            ++modCount;
            //当siez扩大一个大于临界扩容值时，进行扩容操作
            if (++size > threshold)
                resize();
            afterNodeInsertion(evict);
            return null;
        }

}

1.数据初始化

        //将之前的数组的数据保存出来
        Node<K,V>[] oldTab = table;
        //获取之前保存数据的长度，防止未初始化报错
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        //获取之前扩容临界值(capacity*loadFactor)
        int oldThr = threshold;
        //初始化新的容器参数
        int newCap, newThr = 0;

2.生成新容器的容量和扩容临界点

  //判断旧容量有值时
        if (oldCap > 0) {
            //当他大于等于限制的最大容量时(这里可以理解成扩容失败,旧容器的容量值已经超过了默认最大容量,只能将容器的临界值修改为int最大21E)
            if (oldCap >= MAXIMUM_CAPACITY) {
                //扩容临界值默认使用Integer的最大值
                threshold = Integer.MAX_VALUE;
                //然后返回之前的数组结构,将扩容临界值设置为MAXIMUM_CAPACITY，”未进行扩容，只是将扩容临				界值扩大为Integer的最大值"
                return oldTab;
            }

            //判断 之前的长度扩大一倍是否会大于默认的最大长度 并且之前的长度是否大于默认长度16(这里的目的是为了判断容量扩大一倍后是否会超过默认值,如果没有说明新容器可以使用这个容量，并且要大于默认值16)
            //这里设置为@1
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&oldCap >= DEFAULT_INITIAL_CAPACITY)
                //则将之前的扩容临界值扩大一倍
                newThr = oldThr << 1; // double threshold

         //当旧容量长度为0,并且扩容临界值大于0时，将新容量设置为扩容临界值(当Map的数据被清除完时，会出现这种情况) 
         //需要注意的是这里变化了newCap的长度，但是没有变化临界值的长度，这里做一个备注为@2 
         //这里验证了hashMap扩容因子的使用，因为oldThr=(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY) 直接将新容器容量设置为oldThr相当于将旧容器扩充了0.75
        }else if (oldThr > 0)  newCap = oldThr;
        else {     
        //当旧容量长度为0,并且扩容临界值为0时，初始化长度为16 ，扩容临界点为（DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY）
        //这个地方就是hashMap的初始化点          
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }

        //@1的说明当长度为1时，并没有初始化扩容临界值时并且对@2没有初始化变化临界值的长度的补充
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;
            //判断是否new容量是否大于最大值，临界值是否大于最大值，都满足是扩容为他自己否则为Integer最大类型
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }

3.实现数据复制

 //将刚刚判断好的临界值长度复制给现在对象的变化临界值，到这里就将当前对象的容器临界值设定完成
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
        //使用新的长度值创建一个数组，并且传给成员变量
            Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        //这里设置完了，容器的容量值(引用传递)
        table = newTab;

        //这里是将旧数组的的数据遍历出来(未初始化的不会进入)
        if (oldTab != null) {
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                //把已经赋值之后的变量置位null，当然是为了好回收，释放内存
                    oldTab[j] = null;
                    //如果下标处的节点没有下一个元素，说明可以直接保存
                    if (e.next == null)
                     //把该变量的值存入newCap中，数组的坐标为 位运算结果  e.hash & (newCap - 1) 
                     //详情可以看下面解析
                        newTab[e.hash & (newCap - 1)] = e;
                    //当next下面的直属数据大于1时，(JDk1.8使用的数组链表加红黑树，这里就是用的红黑树当						下面有多个时)，本文不作详解  
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                     //当只有一个时使用链表就是 5接2时
                        else { 
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                         //判断0或者1 当e.hash超过了oldCap为！=0  没有超过时为0  详情也可以看下文
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

这里解析一下位运算符&

首先说一下e.hash & (newCap - 1)

当e.hash=5 newCap=16 你会发现e.hash & (newCap - 1) 的值为5，

当e.hash=21 newCap=16 你会发现值同样是5

如果相同的判断都是这个值，那么就会实现链表的挂载或者红黑树，当扩容（成31时)之后你会发现保存的数据的Hash值位原值，一定程度上防止了保存数据的超出索引范围的现象

在这里插入图片描述

然后说一下e.hash & oldCap使用链表只挂5和21时，本人理解当挂多个时会自动生成红黑树所以不会走这里

在这里插入图片描述

当oldCap（初始容量为）16时，由上图可知，之前5和21都是挂载在索引为5的位置，当扩容为31后
在这里插入图片描述
将分别执行下面的代码，loHead为5的数据，hiHead为21的数据，并且分别清楚的next的数据

if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }