Java ConcurrentHashMap分析解读

最新推荐文章于 2024-07-10 21:37:49 发布

kyrie1rv1ng

最新推荐文章于 2024-07-10 21:37:49 发布

阅读量140

点赞数

分类专栏： Java基础文章标签： java

原文链接：https://blog.csdn.net/programmer_at/article/details/79715177

版权

Java基础专栏收录该内容

3 篇文章 0 订阅

订阅专栏

为了弥补HashMap的并发缺陷和Hashtable的性能不行问题，ConcurrentHashMap来了。ConcurrentHashMap底层也是采用数组+链表+红黑树的数据结构进行存储。相比HashMap，有很多相类似的地方，也有些不一样的新东西。

ConcurrentHashMap的Node类

 static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        volatile V val;
        volatile Node<K,V> next;

value next都是volatile对象。

ConcurrentHashMap的TreeNode类

/**
     * Nodes for use in TreeBins
     */
    static final class TreeNode<K,V> extends Node<K,V> {
        TreeNode<K,V> parent;  // red-black tree links
        TreeNode<K,V> left;
        TreeNode<K,V> right;
        TreeNode<K,V> prev;    // needed to unlink next upon deletion
        boolean red;

TreeNode继承Node,而HashMap的TreeNode继承LinkedHashMap的TreeNode；
与HashMap不同的是，当链表长度过长的时候，它并不是直接转换为红黑树，而是把这些结点包装成TreeNode放在TreeBin对象中，由TreeBin完成对红黑树的包装。因此，数组中存放的不再会是TreeNode，而是TreeBin。

TreeBin

**
         * Creates bin with initial set of nodes headed by b.
         */
        TreeBin(TreeNode<K,V> b) {
            super(TREEBIN, null, null, null);
            this.first = b;
            TreeNode<K,V> r = null;
            for (TreeNode<K,V> x = b, next; x != null; x = next) {
                next = (TreeNode<K,V>)x.next;
                x.left = x.right = null;
                if (r == null) {
                    x.parent = null;
                    x.red = false;
                    r = x;
                }
                else {
                    K k = x.key;
                    int h = x.hash;
                    Class<?> kc = null;
                    for (TreeNode<K,V> p = r;;) {
                        int dir, ph;
                        K pk = p.key;
                        if ((ph = p.hash) > h)
                            dir = -1;
                        else if (ph < h)
                            dir = 1;
                        else if ((kc == null &&
                                  (kc = comparableClassFor(k)) == null) ||
                                 (dir = compareComparables(kc, k, pk)) == 0)
                            dir = tieBreakOrder(k, pk);
                            TreeNode<K,V> xp = p;
                        if ((p = (dir <= 0) ? p.left : p.right) == null) {
                            x.parent = xp;
                            if (dir <= 0)
                                xp.left = x;
                            else
                                xp.right = x;
                            r = balanceInsertion(r, x);
                            break;
                        }
                    }
                }
            }
            this.root = r;
            assert checkInvariants(root);
        }

可以看出，通过传入TreeNode节点，构建Treebin对象，也就完成了红黑树的构造。

初始化

初始化方法主要应用了关键属性sizeCtl 如果这个值〈0，表示其他线程正在进行初始化，就放弃这个操作。在这也可以看出ConcurrentHashMap的初始化只能由一个线程完成。如果获得了初始化权限，就用CAS方法将sizeCtl置为-1，防止其他线程进入。初始化数组后，将sizeCtl的值改为0.75*n。

/**
     * Initializes table, using the size recorded in sizeCtl.
     */
    private final Node<K,V>[] initTable() {
        Node<K,V>[] tab; int sc;
        while ((tab = table) == null || tab.length == 0) {
            if ((sc = sizeCtl) < 0)
                Thread.yield(); // lost initialization race; just spin
            else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                try {
                    if ((tab = table) == null || tab.length == 0) {
                        int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                        table = tab = nt;
                        sc = n - (n >>> 2);
                    }
                } finally {
                    sizeCtl = sc;
                }
                break;
            }
        }
        return tab;
    }

Put操作

ConcurrentHashMap依靠CAS+synchronized实现并发插入和更新。

当前bucket为空时，使用CAS操作，将Node放入对应的bucket中。
出现hash冲突，则采用synchronized关键字。倘若当前hash对应的节点是链表的头节点，遍历链表，若找到对应的node节点，则修改node节点的val，否则在链表末尾添加node节点；倘若当前节点是红黑树的根节点，在树结构上遍历元素，更新或增加节点。
倘若当前map正在扩容（即f.hash == MOVED），则跟其他线程一起进行扩容

获取某个bucket的元素

同意也是通过Unsafe类方法

static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {
        return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE);
    }

扩容

扩容的时机：

如果新增节点之后，所在的链表的元素个数大于等于8，则会调用treeifyBin把链表转换为红黑树。在转换结构时，若tab的长度小于MIN_TREEIFY_CAPACITY，默认值为64，则会将数组长度扩大到原来的两倍，并触发transfer，重新调整节点位置。
新增节点后，addCount统计tab中的节点个数大于阈值（sizeCtl），会触发transfer。

整个扩容操作分为两个部分
第一部分是构建一个nextTable,它的容量是原来的两倍，这个操作是单线程完成的。这个单线程的保证是通过ESIZE_STAMP_SHIFT这个常量经过一次运算来保证的，这个地方在后面会有提到；

第二个部分就是将原来table中的元素复制到nextTable中，这里允许多线程进行操作。

并发扩容的流程

遍历整个table，当前节点为空，则采用CAS的方式在当前位置放入fwd。
当前节点已经为fwd(with hash field “MOVED”)，则已经有有线程处理完了了，直接跳过，相当于标志。
当前节点为链表节点或红黑树，重新计算链表节点的hash值，移动到nextTable相应的位置（构建了一个反序链表和顺序链表，分别放置在i和i+n的位置上）。移动完成后，用Unsafe.putObjectVolatile在tab的原位置赋为为fwd, 表示当前节点已经完成扩容。

ForwardingNode

ForwardingNode的hash值为-1，next指针指向下一张新表。
在并发扩容时，原table中已经被处理的Node会被替换为ForwardingNode。

get操作

get操作不需要加锁同步，直接根据key找，找不到返回null。

size

addcount()

private final void addCount(long x, int check) {
        CounterCell[] as; long b, s;
        if ((as = counterCells) != null ||
            !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
            CounterCell a; long v; int m;
            boolean uncontended = true;
            if (as == null || (m = as.length - 1) < 0 ||
                (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
                !(uncontended =
                  U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
                fullAddCount(x, uncontended);
                return;
            }
            if (check <= 1)
                return;
            s = sumCount();
        }
        if (check >= 0) {
            Node<K,V>[] tab, nt; int n, sc;
            while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
                   (n = tab.length) < MAXIMUM_CAPACITY) {
                int rs = resizeStamp(n);
                if (sc < 0) {
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                        transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                        transfer(tab, nt);
                }
                else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                             (rs << RESIZE_STAMP_SHIFT) + 2))
                    transfer(tab, null);
                s = sumCount();
            }
        }
    }

addcount通过CAS操作并发修改baseCount，修改失败的话会将增量放到CounterCell[]数组。因此再统计size时，会统计baseCount和CounterCell[]数组的值。(当然，这个统计值也只是当前的估计值，毕竟弱一致性嘛)

public int size() {
        long n = sumCount();
        return ((n < 0L) ? 0 :
                (n > (long)Integer.MAX_VALUE) ? Integer.MAX_VALUE :
                (int)n);
    }

remove

和put类似，也是通过synchronized (f) ，实现并发的删除。

ConcurrentHashMap 1.7版本

ConcurrentHashMap在JDK7采用数组+链表的方式存储，并发控制使用segment锁，一个segment控制多个桶及链表的并发读写。

ConcurrentHashMap和Hashtable

hash table的迭代器是强一致性的，而concurrenthashmap是弱一致的。
Hashtable的任何操作都会把整个表锁住，是阻塞的，好处是总能获取最实时的更新。
因此并不能将ConcurrentHashMap完全替代Hashtable，在不那么在乎性能并且需要强一致性的场合还是Hashtable合适。
hash table虽然性能上不如ConcurrentHashMap，但并不能完全被取代，两者的迭代器的一致性不同的，hash table的迭代器是强一致性的，而concurrenthashmap是弱一致的。 ConcurrentHashMap的get，clear，iterator 都是弱一致性的。
下面是大白话的解释：

Hashtable的任何操作都会把整个表锁住，是阻塞的。好处是总能获取最实时的更新，比如说线程A调用putAll写入大量数据，期间线程B调用get，线程B就会被阻塞，直到线程A完成putAll，因此线程B肯定能获取到线程A写入的完整数据。坏处是所有调用都要排队，效率较低。
ConcurrentHashMap 是设计为非阻塞的。在更新时会局部锁住某部分数据，但不会把整个表都锁住。同步读取操作则是完全非阻塞的。好处是在保证合理的同步前提下，效率很高。坏处是严格来说读取操作不能保证反映最近的更新。例如线程A调用putAll写入大量数据，期间线程B调用get，则只能get到目前为止已经顺利插入的部分数据。

选择哪一个，是在性能与数据一致性之间权衡。ConcurrentHashMap适用于追求性能的场景，大多数线程都只做insert/delete操作，对读取数据的一致性要求较低。

参考

https://blog.csdn.net/programmer_at/article/details/79715177

kyrie1rv1ng

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Java ConcurrentHashMap分析解读

为了弥补HashMap的并发缺陷和Hashtable的性能不行问题，ConcurrentHashMap来了。ConcurrentHashMap底层也是采用数组+链表+红黑树的数据结构进行存储。相比HashMap，有很多相类似的地方，也有些不一样的新东西。ConcurrentHashMap的Node类 static class Node<K,V> implements Map.Ent...
复制链接

扫一扫