jdk8 ConcurrentHashMap源码与bug分析

Spark4J

已于 2022-10-19 14:41:27 修改

阅读量402

点赞数 2

分类专栏： Java jdk collection 文章标签：链表数据结构散列表

于 2022-01-14 11:38:00 首次发布

本文链接：https://blog.csdn.net/qq_41910280/article/details/122490101

版权

Java 同时被 3 个专栏收录

10 篇文章 0 订阅

订阅专栏

jdk

1 篇文章 0 订阅

订阅专栏

collection

1 篇文章 0 订阅

订阅专栏

jdk8 ConcurrentHashMap源码与bug分析

欢迎转载，转载请注明网址:https://blog.csdn.net/qq_41910280

简介
　　分析了ConcurrentHashMap源码中的put、初始化、扩容等过程。重要的就是理解如何降低锁粒度提升并发度，以及如何多线程协同扩容。

版本说明
2022-01-14 init
2022-10-19 新增前言 HashMap的并发问题描述

文章目录

前言

　　
HashMap有哪些并发问题?
1.新增或者删除
涉及链表或者树的操作, 具体包括:
链表: 当线程一在A节点后面添加B节点, 线程二删除A节点就导致B节点被一起删除
树: 旋转的时候进行操作会产生覆盖
2.扩容
扩容的时候新增可能新增到旧的table

1. put()操作

　　
put很简单和HashMap也差不多，主要多了synchronized头节点的步骤，另外key和value都不允许null
后面类似单线程操作红黑树等基操我就不细说了，不懂的先补数据结构和算法
扩容的具体过程看后面

public V put(K key, V value) {
    return putVal(key, value, false);
}

/** Implementation for put and putIfAbsent */
final V putVal(K key, V value, boolean onlyIfAbsent) {
    if (key == null || value == null) throw new NullPointerException();
    int hash = spread(key.hashCode());
    int binCount = 0;
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        if (tab == null || (n = tab.length) == 0)
            // 1.table为null 初始化
            tab = initTable();
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            // 2.映射的table节点为null 直接新增
            if (casTabAt(tab, i, null,
                         new Node<K,V>(hash, key, value, null)))
                break;                   // no lock when adding to empty bin
        }
        else if ((fh = f.hash) == MOVED)
            // 3.正在扩容 本线程也一起去并发扩容
            tab = helpTransfer(tab, f);
        else {
            // 4.在链表或红黑树上添加节点(红黑树添加节点时, 如果table[].length<64则扩容)
            V oldVal = null;
            // 以前是分段锁 现在只锁头结点 进一步降低所粒度
            // 以前是Segment继承ReentrantLock 现在使用synchronized因为synchronized性能更高 也便于jvm优化(ps 如果用不到Lock的高级功能都建议使用synchronized)
            synchronized (f) {
                if (tabAt(tab, i) == f) {// 预防多个线程同时新增一个bucket的头节点或者头节点刚被移除
                    // 头节点hash>=0为链表 走链表新增
                    // 因为红黑树的头节点的hash固定为TREEBIN(-2) 而链表节点hash通过spread()计算都>0(&HASH_BITS)
                    if (fh >= 0) {
                        binCount = 1;
                        for (Node<K,V> e = f;; ++binCount) {
                            K ek;
                            if (e.hash == hash &&
                                ((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                oldVal = e.val;
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            Node<K,V> pred = e;
                            if ((e = e.next) == null) {
                                pred.next = new Node<K,V>(hash, key,
                                                          value, null);
                                break;
                            }
                        }
                    }
                    else if (f instanceof TreeBin) {
                        // 红黑树新增
                        Node<K,V> p;
                        binCount = 2;
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                       value)) != null) {
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            if (binCount != 0) {
                if (binCount >= TREEIFY_THRESHOLD)
                    // 链表转红黑树(线程安全)
                    treeifyBin(tab, i);
                if (oldVal != null)
                    return oldVal;
                break;
            }
        }
    }
    // 节点总数+1 (尝试cas新增baseCount,如果失败就根据线程随机到一个CounterCell去新增, 为了降低并发竞争)
    addCount(1L, binCount);
    return null;
}

2. 初始化表格initTable()

　　
需要先理解一个变量sizeCtl 和一个函数resizeStamp()

/**
 * 在初始化完成之前,没有指定初始大小默认是0,>0是表的初始大小
 * 扩容时,(最高的一位一定是1, 因此<0)
 * 高16位是扩容标识(计算见resizeStamp())
 * 低16位如果是1表示在初始化 N表示有N-1个线程在扩容,
 * 其他情况下是扩容阈值
 */
private transient volatile int sizeCtl;

resizeStamp()是用来生成扩容标识

/**
 * 第一个线程扩容时会执行这行代码 U.compareAndSwapInt(this, SIZECTL, sc, (rs << RESIZE_STAMP_SHIFT) + 2)
 * 1 << (RESIZE_STAMP_BITS - 1) 将rs第16位设置为1, (rs << RESIZE_STAMP_SHIFT) + 2 后sizeCtl一定是负数 (高16位是rs,低16位是2,代表有1个线程参与扩容)
 * 本函数计算的结果rs作为高16位的唯一扩容标记(因为n是2的倍数所以每次扩容之后 Integer.numberOfLeadingZeros(n) 都会变化)
 */
static final int resizeStamp(int n) {
    return Integer.numberOfLeadingZeros(n) | (1 << (RESIZE_STAMP_BITS - 1));
}

有了这些基础之后再来看初始化

private final Node<K,V>[] initTable() {
    Node<K,V>[] tab; int sc;
    while ((tab = table) == null || tab.length == 0) {
        if ((sc = sizeCtl) < 0)// 其他线程在初始化
            Thread.yield(); // lost initialization race; just spin
        else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
            // 初始化
            try {
                if ((tab = table) == null || tab.length == 0) {
                    int n = (sc > 0) ? sc : DEFAULT_CAPACITY;// 初始化大小
                    @SuppressWarnings("unchecked")
                    Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                    table = tab = nt;
                    sc = n - (n >>> 2);// 阈值0.75*n
                }
            } finally {
                sizeCtl = sc;
            }
            break;
        }
    }
    return tab;
}

3. 并发扩容helpTransfer和transfer

需要先看初始化中sizeCtl和resizeStamp部分

扩容可以理解为消费者模式, 表的每一个bucket都是一个需要处理的任务或者产品, 因此可以多个线程并发协同去处理
transferIndex 正是用来在多个线程中分配任务的控制变量

/**
 * 指向下一个需要转移的bucket
 */
private transient volatile int transferIndex;

helpTransfer(当前线程join扩容大军)

final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
    Node<K,V>[] nextTab; int sc;
    // instanceof ForwardingNode表示表正在扩容(当前bucket被其他线程)
    if (tab != null && (f instanceof ForwardingNode) &&
        (nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
        int rs = resizeStamp(tab.length);
        while (nextTab == nextTable && table == tab &&
               (sc = sizeCtl) < 0) {// 小于0说明还在扩容
            // 扩容标志发生了变化(扩容结束) || 扩容即将结束 || 达到最大并发扩容线程数量 || 没有需要分配的任务
            // sc == rs + 1 || sc == rs + MAX_RESIZERS有bug, 在jdk17这个方法内的rs变量赋值语句为
            // int rs = resizeStamp(n) << RESIZE_STAMP_SHIFT;
            if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                sc == rs + MAX_RESIZERS || transferIndex <= 0)
                break;
            // 扩容线程数量增加1
            if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {
                transfer(tab, nextTab);
                break;
            }
        }
        return nextTab;
    }
    return table;
}

具体去扩容的方法函数transfer

private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
    int n = tab.length, stride;
    // stride是用来分配任务的范围, 即一次分配多少任务
    // stride 在单核下直接等于 n，多核模式下为 (n>>>3)/NCPU，最小值是 16
    if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
        stride = MIN_TRANSFER_STRIDE; // subdivide range
    if (nextTab == null) {            // initiating
        // 如果nextTab为null 则初始化新表
        try {
            @SuppressWarnings("unchecked")
            Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
            nextTab = nt;
        } catch (Throwable ex) {      // try to cope with OOME
            sizeCtl = Integer.MAX_VALUE;
            return;
        }
        nextTable = nextTab;
        transferIndex = n;// 倒序获取bucket(可能为了避免处理溢出)
    }
    int nextn = nextTab.length;
    ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
    boolean advance = true;// 是否继续获取下一个bucket
    boolean finishing = false; // to ensure sweep before committing nextTab
    for (int i = 0, bound = 0;;) {
        Node<K,V> f; int fh;
        while (advance) {
            int nextIndex, nextBound;
            if (--i >= bound || finishing)// --i >= bound 获得的任务还没处理完 配合for循环继续处理(每完成一个bucket还是会设置advance为true),  finishing表示扩容完成 可以结束
                advance = false;
            else if ((nextIndex = transferIndex) <= 0) {// 没有任务可供获取
                i = -1;
                advance = false;
            }
            else if (U.compareAndSwapInt
                     (this, TRANSFERINDEX, nextIndex,
                      nextBound = (nextIndex > stride ?
                                   nextIndex - stride : 0))) {
                // 获得nextIndex-1到nextBound的任务
                // i是上界 bound是下界
                bound = nextBound;
                i = nextIndex - 1;
                advance = false;
            }
        }
        if (i < 0 || i >= n || i + n >= nextn) {// i < 0表示任务已经被分配完了
            int sc;
            if (finishing) {
                // 更新table
                nextTable = null;
                table = nextTab;
                sizeCtl = (n << 1) - (n >>> 1);// 更新阈值+扩容标识
                return;
            }
            // 第一个扩容的线程会设置 sizeCtl = (rs << RESIZE_STAMP_SHIFT) + 2
            // 因此最后一个完成扩容的线程 (sc - 2) == resizeStamp(n)
            if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {// 完成了自己的任务, 减少并发线程数量
                if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                	// 不是最后一个线程
                    return;
                finishing = advance = true;// 是最后一个线程
                i = n; // recheck before commit
            }
        }
        else if ((f = tabAt(tab, i)) == null)
            // 在空bucket放置fwd标识再扩容 预防其他线程put到旧表
            advance = casTabAt(tab, i, null, fwd);
        else if ((fh = f.hash) == MOVED)
            // 已经处理了 直接去下一个bucket
            advance = true; // already processed
        else {
            // 开始处理这个bucket
            synchronized (f) {
                if (tabAt(tab, i) == f) {
                    Node<K,V> ln, hn;
                    if (fh >= 0) {
                        // 处理链表
                        // 将链表节点为低位链表ln和高位链表hn, 后续ln设置在原位置i的位置,hn设置在i+n的位置, 无需重新散列
                        // 原理是 散列时&(n-1)与&(2n-1)区别只在于hash在2n-1比n-1高的那一位是0或是1
                        int runBit = fh & n;// 为0是低位 不为0是高位
                        Node<K,V> lastRun = f;
                        // 为了将尾部的节点放在链表头部 (局部性原理)
                        for (Node<K,V> p = f.next; p != null; p = p.next) {
                            int b = p.hash & n;
                            if (b != runBit) {
                                runBit = b;
                                lastRun = p;
                            }
                        }
                        // 最后一个节点是高位还是低位
                        if (runBit == 0) {
                            ln = lastRun;
                            hn = null;
                        }
                        else {
                            hn = lastRun;
                            ln = null;
                        }
                        // 生成链表
                        for (Node<K,V> p = f; p != lastRun; p = p.next) {
                            int ph = p.hash; K pk = p.key; V pv = p.val;
                            if ((ph & n) == 0)
                                ln = new Node<K,V>(ph, pk, pv, ln);
                            else
                                hn = new Node<K,V>(ph, pk, pv, hn);
                        }
                        // 设置到新的表
                        setTabAt(nextTab, i, ln);
                        setTabAt(nextTab, i + n, hn);
                        // 标记为fwd
                        setTabAt(tab, i, fwd);
                        advance = true;
                    }
                    else if (f instanceof TreeBin) {
                        // 处理红黑树
                        TreeBin<K,V> t = (TreeBin<K,V>)f;
                        TreeNode<K,V> lo = null, loTail = null;
                        TreeNode<K,V> hi = null, hiTail = null;
                        int lc = 0, hc = 0;
                        for (Node<K,V> e = t.first; e != null; e = e.next) {
                            int h = e.hash;
                            TreeNode<K,V> p = new TreeNode<K,V>
                                (h, e.key, e.val, null, null);
                            if ((h & n) == 0) {
                                if ((p.prev = loTail) == null)
                                    lo = p;
                                else
                                    loTail.next = p;
                                loTail = p;
                                ++lc;
                            }
                            else {
                                if ((p.prev = hiTail) == null)
                                    hi = p;
                                else
                                    hiTail.next = p;
                                hiTail = p;
                                ++hc;
                            }
                        }
                        ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                            (hc != 0) ? new TreeBin<K,V>(lo) : t;
                        hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                            (lc != 0) ? new TreeBin<K,V>(hi) : t;
                        setTabAt(nextTab, i, ln);
                        setTabAt(nextTab, i + n, hn);
                        setTabAt(tab, i, fwd);
                        advance = true;
                    }
                }
            }
        }
    }
}

参考文献

1.https://www.sohu.com/a/320372210_120176035
2.jdk源码
3.本活动与苹果公司无关[滑稽]

神奇的小尾巴：
本人邮箱：zhouyouchn@126.com zhoooooouyou@gmail.com
zhouyou@whut.edu.cn　欢迎交流，共同进步。
欢迎转载，转载请注明本网址。

Spark4J

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
jdk8 ConcurrentHashMap源码与bug分析

jdk8 ConcurrentHashMap源码与bug分析欢迎转载，转载请注明网址:https://blog.csdn.net/qq_41910280简介　　分析了ConcurrentHashMap源码中的put、初始化、扩容等过程。重要的就是理解如何降低锁粒度提升并发度，以及如何多线程协同扩容。文章目录jdk8 ConcurrentHashMap源码与bug分析1. put()操作2. 初始化表格initTable()3. 并发扩容helpTransfer和transfer参考文献
复制链接

扫一扫