ConcurrentHashMap分析

最新推荐文章于 2023-05-08 10:22:14 发布

置顶 wjs_marvin

最新推荐文章于 2023-05-08 10:22:14 发布

阅读量147

点赞数

分类专栏： Java并发文章标签： java hashmap

本文链接：https://blog.csdn.net/wjs_marvin/article/details/107090175

版权

Java并发专栏收录该内容

2 篇文章 0 订阅

订阅专栏

ConcurrentHashMap分析

1.存储结构

private static final int DEFAULT_CAPACITY = 16;//默认大小
transient volatile Node<K,V>[] table;
private transient volatile Node<K,V>[] nextTable;

默认大小16，采用node数组存储数据，nextTable代表扩容时的新数组，初始置Null，resize中会初始化原大小的两倍数组，resize完后也会重置为空。

private transient volatile int sizeCtl;

重要参数，类似hashMap中的threshold，无论是初始化哈希表，还是扩容 rehash 的过程，都是需要依赖这个关键属性的。该属性有以下几种取值：

0:默认值
-1：初始化中，且只有一个线程，其它线程让出CPU等待
大于0：相当于 HashMap 中的 threshold，表示阈值
小于-1：代表有多个线程正在进行扩容,

private transient volatile int transferIndex;

该属性为扩容时指向带扩容数组的下标，初始为扩容数组长度

private transient volatile long baseCount;
private transient volatile int cellsBusy;
private transient volatile CounterCell[] counterCells;//分段数组

采用类似LongAdder的分开计数的方式计算size，baseCount代表基础size，当无线程竞争是修改该值，cellsBusy代表并发扩容或者new CounterCell的Case状态锁。

1.1 节点类型

node节点描述：

final int hash;//hash值
final K key;
volatile V val;
volatile Node<K,V> next;//next节点

以下节点均继承该节点实现：

node:普通节点
ForwardingNode:临时节点，hash值为-1，在扩进行中才会出现，不存储实际的数据，如果旧数组的一个hash桶中全部的节点都迁移到新数组中，旧数组就在这个hash桶中放置一个ForwardingNode，读操作或者迭代读时碰到ForwardingNode时，将操作转发到扩容后的新的table数组上去执行，写操作碰见它时，则尝试帮助扩容。
ReservationNode: 保留节点
TreeBin:代理操作TreeNode的特殊节点，因为红黑树进行写入操作，整个树的结构可能会有很大的变化，这个对读线程有很大的影响，内部维持一个读写锁以及等待队列。
TreeBin：实际存储树节点。

2.put的方法分析

final V putVal(K key, V value, boolean onlyIfAbsent) {
    //注意：value为Null的时候会抛出NPE异常
    if (key == null || value == null) throw new NullPointerException();
        //计算键所对应的 hash 值
        int hash = spread(key.hashCode());
        int binCount = 0;
        for (Node<K,V>[] tab = table;;) {
            Node<K,V> f; int n, i, fh;
            if (tab == null || (n = tab.length) == 0)
                //初始化table
                tab = initTable();
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
                //如果当前哈希槽没有节点，那么以CAS无锁式向该位置添加一个节点
                if (casTabAt(tab, i, null,
                             new Node<K,V>(hash, key, value, null)))
                    break;                   // no lock when adding to empty bin
            }
            //哈希槽节点正在扩容，则帮助扩容
            else if ((fh = f.hash) == MOVED)
                tab = helpTransfer(tab, f);
            else {
                V oldVal = null;
                //锁住链表的头结点
                synchronized (f) {
                    //并发两重判断
                    if (tabAt(tab, i) == f) {
                        if (fh >= 0) {
                            //插入新节点至链表尾部
                            binCount = 1;//链表长度
                            for (Node<K,V> e = f;; ++binCount) {
                                K ek;
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)
                                        e.val = value;
                                    break;
                                }
                                Node<K,V> pred = e;
                                if ((e = e.next) == null) {
                                    pred.next = new Node<K,V>(hash, key,
                                                              value, null);
                                    break;
                                }
                            }
                        }
                        //红黑树节点 hash=-2 其它则在迁移中
                        else if (f instanceof TreeBin) {
                            Node<K,V> p;
                            binCount = 2;
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                           value)) != null) {
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                if (binCount != 0) {
                    //链表长度>=8 转换红黑树
                    if (binCount >= TREEIFY_THRESHOLD)
                        treeifyBin(tab, i);
                    //如果是新插入节点 直接return旧值
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        //插入了新节点才能走到这里，计算map的size,并判断是否需要扩容
        addCount(1L, binCount);
        return null;
    }

新节点总是在尾部添加，添加完后进行扩容判断。
接下来分析下table初始化：

private final Node<K,V>[] initTable() {
    Node<K,V>[] tab; int sc;
    //循环cas更新sizectl
    while ((tab = table) == null || tab.length == 0) {
        //sizeCtl<0 正在初始化
        if ((sc = sizeCtl) < 0)
            //放弃cup，循环等待初始化完成
            Thread.yield(); // lost initialization race; just spin
        //没有线程初始化 cas把sizectl置为-1，表示初始化中
        else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
            try {
                //并发双重验证table是否已初始化
                if ((tab = table) == null || tab.length == 0) {
                    int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                    @SuppressWarnings("unchecked")
                    Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                    table = tab = nt;
                    //sc为threshold，扩容阈值，大小为n*0.75
                    sc = n - (n >>> 2);
                }
            } finally {
                sizeCtl = sc;
            }
            break;
        }
    }
    return tab;
}

只允许一个线程对表进行初始化，如果不巧有其他线程进来了，那么会让其他线程交出 CPU 等待下次系统调度。这样，保证了表同时只会被一个线程初始化。

接下俩看下新增节点map.szie如何计算，addCount方法：

private final void addCount(long x, int check) {
    CounterCell[] as; long b, s;
    //尝试更新baseCount，如果有多线程并发修改，则尝试随机修改分散数组元素
    if ((as = counterCells) != null ||
        !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
        CounterCell a; long v; int m;
        boolean uncontended = true;
        //多线程二次判断空
        if (as == null || (m = as.length - 1) < 0 ||
            //随机获取元素为空或则有线程并发修改(cas失败)，则循环cas并发修改（longAdder方式）
            (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
            !(uncontended =
              U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
            fullAddCount(x, uncontended);
            return;
        }
        //链表长度<=1 不需要考虑扩容
        if (check <= 1)
            return;
        //统计ConcurrentHashMap元素个数
        s = sumCount();
    }
    if (check >= 0) {
        Node<K,V>[] tab, nt; int n, sc;
        //当元素个数大于sizeCtl（threshold扩容阈值）小于最大值，进行扩容 
        while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
               (n = tab.length) < MAXIMUM_CAPACITY) {
            //返回的是对 n 的一个数据校验标识，占 16 位 高位为1
            int rs = resizeStamp(n);
            if (sc < 0) {
                if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                    sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                    transferIndex <= 0)
                    break;
                //sizeCtl<0 代表扩容线程数
                if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                    transfer(tab, nt);
            }
            //只有一个线程能修改成功，其他线程while重新循环，sizeCtl是volatile变量，保证可见性
            //rs << 16 左移位负数，(rs << RESIZE_STAMP_SHIFT) + 2) 表示一个线程
            else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                         (rs << RESIZE_STAMP_SHIFT) + 2))
                //扩容
                transfer(tab, null);
            //重新计算size
            s = sumCount();
        }
    }
}

3.扩容

接下来分析下扩容transfer方法：

private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
    int n = tab.length, stride;
    //根据CPU数计算每个线程扩容哈希桶 最小为16
    if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
        stride = MIN_TRANSFER_STRIDE; // subdivide range
    //第一个扩容线程 初始化新数组
    if (nextTab == null) {            // initiating
        try {
            @SuppressWarnings("unchecked")
            Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
            nextTab = nt;
        } catch (Throwable ex) {      // try to cope with OOME
            sizeCtl = Integer.MAX_VALUE;
            return;
        }
        nextTable = nextTab;
        //开始扩容 更新扩容数组下标
        transferIndex = n;
    }
    int nextn = nextTab.length;
    // 创建一个 fwd 节点，用于占位。当别的线程发现这个槽位中是 fwd 类型的节点，则跳过这个节点
    ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
    //表示当前扩容段是否扩容完成，true则取向前推进，扩容下一段扩容区间
    boolean advance = true;
    boolean finishing = false; // to ensure sweep before committing nextTab
    //死循环 确保所有桶扩容完成，i 表示数组扩容最大下标，bound 数组扩容最小下标
    for (int i = 0, bound = 0;;) {
        Node<K,V> f; int fh;
        //初始每个线程取需要转移的桶区间
        while (advance) {
            int nextIndex, nextBound;
            //当前区间任务还未做完，取下一个桶 或者整个扩容任务完成 无需取新任务，跳出循环修改sizeCtl等
            if (--i >= bound || finishing)
                advance = false;
            //扩容数组下标<=0 说明已经没有区间需要扩容了
            else if ((nextIndex = transferIndex) <= 0) {
                //-1 下面会直接进入结束扩容动作
                i = -1;
                advance = false;
            }
            //cas修改transferIndex扩容数组下标
            else if (U.compareAndSwapInt
                     (this, TRANSFERINDEX, nextIndex,
                      nextBound = (nextIndex > stride ?
                                   nextIndex - stride : 0))) {
                //倒序转移 表示最小转移下标
                bound = nextBound;
                //表示最大转移下标
                i = nextIndex - 1;
                advance = false;
            }
        }
        //i < 0 表示已没有需要转移的桶
        if (i < 0 || i >= n || i + n >= nextn) {
            int sc;
            //已完成转移 更改sizeCtl 新数组长度0.75 这里最终只会有一个线程 
            if (finishing) {
                nextTable = null;
                table = nextTab;
                sizeCtl = (n << 1) - (n >>> 1);
                return;
            }
            //cas修改sizeCtl，线程数-1
            if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                //表示不是最后一个线程 直接返回
                if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                    return;
                //是最后一个线程更改finishing，重新循环执行上面的代码，保证只有一个线程
                finishing = advance = true;
                i = n; // recheck before commit
            }
        }
        else if ((f = tabAt(tab, i)) == null)
            //桶上没有节点，Cas修改原数组该节点为fwd节点
            advance = casTabAt(tab, i, null, fwd);
        else if ((fh = f.hash) == MOVED)
            //已经处理过了，循环判断是否取下个区间还是已完成或者 取下一个桶 --i
            advance = true; // already processed
        else {
            //独占锁 锁住头节点 进一步降低锁的粒度
            synchronized (f) {
                //双重判断在这期间头节点是否被修改 否则重新循环处理
                if (tabAt(tab, i) == f) {
                    //ln 表示不需要移位的节点 hn表示移动hash位
                    Node<K,V> ln, hn;
                    //普通节点
                    if (fh >= 0) {
                        //取hash的高位 由于n=2的整数(1000)幂且扩容后的新长度为 n << 1(10000),定位hash桶位置为hash & n-1（111） ，只需要知道hash的高一位是否为1，如果为1，这个该元素在新数组的位置为index+n，hash&n（1000）取高一位
                        int runBit = fh & n;
                        //取该链表最后一个与上一个节点hash不同的节点
                        //减少下面遍历的长度，如果后续节点的hash都一样，只需取该节点移位
                        Node<K,V> lastRun = f;
                        //qu
                        for (Node<K,V> p = f.next; p != null; p = p.next) {
                            int b = p.hash & n;
                            if (b != runBit) {
                                runBit = b;
                                lastRun = p;
                            }
                        }
                        //高位0 表示不需要移动hash桶
                        if (runBit == 0) {
                            ln = lastRun;
                            hn = null;
                        }
                        else {
                            hn = lastRun;
                            ln = null;
                        }
                        //遍历到最后一个hash变更的节点
                        for (Node<K,V> p = f; p != lastRun; p = p.next) {
                            int ph = p.hash; K pk = p.key; V pv = p.val;
                            if ((ph & n) == 0)
                                ln = new Node<K,V>(ph, pk, pv, ln);
                            else
                                hn = new Node<K,V>(ph, pk, pv, hn);
                        }
                        //unsafe设置数组元素
                        setTabAt(nextTab, i, ln);
                        //移动到i+n位置
                        setTabAt(nextTab, i + n, hn);
                        //设置原数组hash桶位fwd节点
                        setTabAt(tab, i, fwd);
                        //继续验证下一个节点
                        advance = true;
                    }
                    //树节点
                    else if (f instanceof TreeBin) {
                        TreeBin<K,V> t = (TreeBin<K,V>)f;
                        TreeNode<K,V> lo = null, loTail = null;
                        TreeNode<K,V> hi = null, hiTail = null;
                        int lc = 0, hc = 0;
                        for (Node<K,V> e = t.first; e != null; e = e.next) {
                            int h = e.hash;
                            TreeNode<K,V> p = new TreeNode<K,V>
                                (h, e.key, e.val, null, null);
                            // 和链表相同的判断，与运算 == 0 的放在低位
                            if ((h & n) == 0) {
                                if ((p.prev = loTail) == null)
                                    lo = p;
                                else
                                    loTail.next = p;
                                loTail = p;
                                ++lc;
                            }
                            else {
                                if ((p.prev = hiTail) == null)
                                    hi = p;
                                else
                                    hiTail.next = p;
                                hiTail = p;
                                ++hc;
                            }
                        }
                        // 如果树的节点数小于等于 6，那么转成链表，反之，创建一个新的树
                        ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                            (hc != 0) ? new TreeBin<K,V>(lo) : t;
                        hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                            (lc != 0) ? new TreeBin<K,V>(hi) : t;
                        //和链表一样设置 节点
                        setTabAt(nextTab, i, ln);
                        setTabAt(nextTab, i + n, hn);
                        setTabAt(tab, i, fwd);
                        advance = true;
                    }
                }
            }
        }
    }
}

// 返回的是对 n 的一个数据校验标识，占 16 位
static final int resizeStamp(int n) {
    return Integer.numberOfLeadingZeros(n) | (1 << (RESIZE_STAMP_BITS - 1));
}

从上面的分析可以看出，如果自始至终，只有一个线程，会分批处理hash桶，处理完之后继续处理下一个区间的hash桶，如果是多线程通过cas尝试更改任务区间下标transferIndex值，更新成功则确认认领这一段区间任务，每更新完一个hash桶，则修改老的数组hash桶的头节点位ForwardingNode，多线程处理会根据hash桶的头节点类型ForwardingNode，去帮助扩容。

final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
    Node<K,V>[] nextTab; int sc;
    //再次验证节点类型并验证新数组是否为空，可能期间已完成扩容nextTab置null
    if (tab != null && (f instanceof ForwardingNode) &&
        (nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
        int rs = resizeStamp(tab.length);
        while (nextTab == nextTable && table == tab &&
               (sc = sizeCtl) < 0) {
            //一些条件判断 大致时sizeCtl被修改了 或扩容完了 
            if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                sc == rs + MAX_RESIZERS || transferIndex <= 0)
                break;
            //修改sizeCtl，线程数+1
            if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {
                //扩容
                transfer(tab, nextTab);
                break;
            }
        }
        return nextTab;
    }
    return table;
}

多线程扩容，就是多线程去获取自己的那一段任务，然后来完成。

4.size方法分析

1.8后对计算size也做了比较大的改变，采用类似LongAdder的分开存储的方式计算，大大提高了并发的性能。
采用了basecount、counterCells两个元素存储。
计算size的方法：

final long sumCount() {
    CounterCell[] as = counterCells; CounterCell a;
    long sum = baseCount;
    //累加counterCells数组的值
    if (as != null) {
        for (int i = 0; i < as.length; ++i) {
            if ((a = as[i]) != null)
                sum += a.value;
        }
    }
    return sum;
}

可以看到并未加锁，每个变量都是volatile修饰保证了可见性。

5.总结

ConcurrentHashMap的多线程扩容，就是分段取任务，如果当前线程发现正在扩容，帮助扩容，充分利用线程。使用Cas+volatile 变量控制一些状态，Synchroized保证实际修改Map的原子性。

JDK1.8对该集合做了大量的改造：

1.降低了锁的粒度
从锁segment到hash头节点，意味着最大并发为table数组的大小。
2.+红黑树的结构
3. 从ReentrantLock换成了Cas+Synchroized
这个优化点个人认为1.6后对Synchroized做了大量的优化，引入了偏向锁、自旋锁，对于锁粒度已经如此细化了，并发争抢可能已经没有那么激烈，同一个线程偏向锁能够加快获取锁的速度，如果有竞争自旋也很快能重新获取锁，避免挂起上下文切换和升级为重量锁，而ReentrantLock只是尝试获取锁，未获取到则新建node在重试一次就被挂起。
4.size的计算方式，新增字段 transient volatile CounterCell[] counterCells

到此ConcurrentHashMap基本分析完成了，再次膜拜Doug Lea大神。
阿里的码出高效：在各种多线程应用场景中，推荐使用此集合进行KV键值对的存储与使用。

wjs_marvin

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ConcurrentHashMap分析

ConcurrentHashMap分析1.存储结构private static final int DEFAULT_CAPACITY = 16;//默认大小transient volatile Node<K,V>[] table;private transient volatile Node<K,V>[] nextTable;默认大小16，采用node数组存储数据，nextTable代表扩容时的新数组，初始置Null，resize中会初始化原大小的两倍数组，resize
复制链接

扫一扫