ConcurrentHashMap的扩容与数据迁移

目录

扩容的条件

transfer扩容

数据迁移

高低位的作用

扩容的条件

while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
                   (n = tab.length) < MAXIMUM_CAPACITY) {//1
                int rs = resizeStamp(n);//2
                if (sc < 0) {//3
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                        transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))//4
                        transfer(tab, nt);
                }
                else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                             (rs << RESIZE_STAMP_SHIFT) + 2))//5
                    transfer(tab, null);
                s = sumCount();
            }
  1. 当s(当前集合大小)大于等于sizeCtl(扩容阈值,上一篇提到过,如果是长度16的数组,阈值为12)时并且node数组长度小于最大值时触发扩容。sizeCtl在-1时代表正在初始化node数组,初始化完成后会记录下一次触发扩容的极限值,第一条开始扩容是会赋值为一个唯一的扩容戳(基于当前node数组的长度),后续每有一个线程加入扩容时都会加一,退出扩容时都会减一,也就是说当正在扩容时,sizeCtl 的值为:((rs << RESIZE_STAMP_SHIFT) + 2) + (正在扩容的线程数-1) ,并且该状态下 sizeCtl < 0 。
  2. 生成此次扩容的唯一扩容戳,基于当前node数组生成。
  3. sc<0代表有线程正在扩容。
  4. 有线程正在扩容的情况下加入到扩容大军中,将SIZECTL加一
  5. 如果 没有线程正在扩容,则将SIZECTL设置为一个负数(rs << RESIZE_STAMP_SHIFT) + 2

transfer扩容

private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
        int n = tab.length, stride;
        if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
            stride = MIN_TRANSFER_STRIDE; // subdivide range
        if (nextTab == null) {            // initiating   1
            try {
                @SuppressWarnings("unchecked")
                Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
                nextTab = nt;
            } catch (Throwable ex) {      // try to cope with OOME
                sizeCtl = Integer.MAX_VALUE;
                return;
            }
            nextTable = nextTab;
            transferIndex = n;
        }
        int nextn = nextTab.length;
        ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);//2
        boolean advance = true;
        boolean finishing = false; // to ensure sweep before committing nextTab
        for (int i = 0, bound = 0;;) {
            Node<K,V> f; int fh;
            while (advance) {
                int nextIndex, nextBound;
                if (--i >= bound || finishing)
                    advance = false;
                else if ((nextIndex = transferIndex) <= 0) {
                    i = -1;
                    advance = false;
                }
                else if (U.compareAndSwapInt
                         (this, TRANSFERINDEX, nextIndex,
                          nextBound = (nextIndex > stride ?
                                       nextIndex - stride : 0))) {//3
                    bound = nextBound;
                    i = nextIndex - 1;
                    advance = false;
                }
            }
            if (i < 0 || i >= n || i + n >= nextn) {//4
                int sc;
                if (finishing) {
                    nextTable = null;
                    table = nextTab;
                    sizeCtl = (n << 1) - (n >>> 1);
                    return;
                }
                if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                    if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                        return;
                    finishing = advance = true;
                    i = n; // recheck before commit
                }
            }
            else if ((f = tabAt(tab, i)) == null)
                advance = casTabAt(tab, i, null, fwd);
            else if ((fh = f.hash) == MOVED)
                advance = true; // already processed
            else {
  1.  nextTab是扩容时将数据从旧的node数组迁移到新的node数组,如果 nextTab未初始化,则进行初始化。n<<1表示原node数组16左移1位得到32,说明新的node数组长度是32。
  2. fwd代表一个标识,当一个线程将一个node迁移完成之后,将其进行标记,其他线程再对这个node进行hash时为MOVED就直接跳过。
  3. 设置扩容边界和下标,bound=0,i=15。线程会从下标15处向前处理每一个node的数据迁移。
  4. 遍历完成后,如果完成了扩容,则更新node数组和sizeCtl下次扩容的阈值;如果没有完成扩容,则将sizeCtl减一,表示当前线程退出了扩容。

数据迁移

else {
                synchronized (f) {
                    if (tabAt(tab, i) == f) {
                        Node<K,V> ln, hn;
                        if (fh >= 0) {// 1
                            int runBit = fh & n;
                            Node<K,V> lastRun = f;
                            for (Node<K,V> p = f.next; p != null; p = p.next) {
                                int b = p.hash & n;
                                if (b != runBit) {
                                    runBit = b;
                                    lastRun = p;
                                }
                            }
                            if (runBit == 0) {
                                ln = lastRun;
                                hn = null;
                            }
                            else {
                                hn = lastRun;
                                ln = null;
                            }
                            for (Node<K,V> p = f; p != lastRun; p = p.next) { // 2
                                int ph = p.hash; K pk = p.key; V pv = p.val;
                                if ((ph & n) == 0)
                                    ln = new Node<K,V>(ph, pk, pv, ln);
                                else
                                    hn = new Node<K,V>(ph, pk, pv, hn);
                            }
                            setTabAt(nextTab, i, ln);
                            setTabAt(nextTab, i + n, hn);
                            setTabAt(tab, i, fwd);
                            advance = true;
                        }
                        else if (f instanceof TreeBin) {
                            TreeBin<K,V> t = (TreeBin<K,V>)f;
                            TreeNode<K,V> lo = null, loTail = null;
                            TreeNode<K,V> hi = null, hiTail = null;
                            int lc = 0, hc = 0;
                            for (Node<K,V> e = t.first; e != null; e = e.next) {
                                int h = e.hash;
                                TreeNode<K,V> p = new TreeNode<K,V>
                                    (h, e.key, e.val, null, null);
                                if ((h & n) == 0) {
                                    if ((p.prev = loTail) == null)
                                        lo = p;
                                    else
                                        loTail.next = p;
                                    loTail = p;
                                    ++lc;
                                }
                                else {
                                    if ((p.prev = hiTail) == null)
                                        hi = p;
                                    else
                                        hiTail.next = p;
                                    hiTail = p;
                                    ++hc;
                                }
                            }
                            ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                                (hc != 0) ? new TreeBin<K,V>(lo) : t;
                            hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                                (lc != 0) ? new TreeBin<K,V>(hi) : t;
                            setTabAt(nextTab, i, ln);
                            setTabAt(nextTab, i + n, hn);
                            setTabAt(tab, i, fwd);
                            advance = true;
                        }
                    }
                }
            }
  1. fh是当前node的hash值,如果>0则表示这个节点还没有被其他线程处理过。通过fh&n(与运算,n是旧node数组的长度)得到runBit。遍历链表对runBit进行修改,最后runBit为0则将其设置为低位节点,否则设置为高位节点。

2.构造高位以及低位的链表,即将链表分为高位和地位两个链表,将低位链表的位置保持不动(即旧的node数组中是什么下标,那么在新的node数组中就是什么下标),将高位链表的位置由原先的下标n放到新node数组的n+16(扩容增加的长度)。

高低位的作用

首先在putVal()方法中有这样一句代码tabAt(tab, i = (n - 1) & hash)来获取node数组某一下标的节点,所以很明显 (n - 1) & hash就是用来获取下标的,这个代表当前node数组的最大下标数和key的hash值的与运算。

设某个hash值为20,二进制0001 0100

当长度为16时,15&20=0000 1111 & 0001 0100=0000 0100=4

当长度为32时(扩容后),31&20=0001 1111 & 0001 0100 =0001 0100=20

可以看到,相同hash在不同的node数组长度的情况下得到的下标是不一样的。

再来看,当hash值为60时

60 & 15=0011 1100&0000 1111=0000 1100=12

60 & 31=0011 1100&0001 1111=0001 1100=28

可以看到两种hash在不同的node数组长度下,当计算下标不同时,相差都是16,也就是扩容的长度。

说白了,就是在迁移某个下标的链表时,当发现链表节点的hash和旧数组长度进行与运算fh & n的第X位为1时(为1时是高位,为0时是低位),说明这个节点的hash在扩容后和(新数组长度-1)的与运算得到的下标与原下标不同,而这个差值刚好是扩容长度16(32-16)。所以将高位直接迁移到原数组下标+扩容长度(16)的位置。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值