1.8环境下的ConcurrentHashMap

最新推荐文章于 2024-05-14 10:16:13 发布

沐ぅ阳

最新推荐文章于 2024-05-14 10:16:13 发布

阅读量875

点赞数

文章标签： java

本文链接：https://blog.csdn.net/qq_49771984/article/details/110938193

版权

前言

HashMap在高并发的环境下，执行put操作会导致HashMap的Entry链表形成环形数据结构，从而导致Entry的next节点始终不为空，因此产生死循环获取Entry
HashTable虽然是线程安全的，但是效率低下，当一个线程访问HashTable的同步方法时，其他线程如果也访问HashTable的同步方法，那么会进入阻塞或者轮训状态。
在jdk1.6中ConcurrentHashMap使用锁分段技术提高并发访问效率。首先将数据分成一段一段地存储，然后给每一段数据配一个锁，当一个线程占用锁访问其中一段数据时，其他段的数据也能被其他线程访问。然而在jdk1.8中的实现已经抛弃了Segment分段锁机制，利用CAS+Synchronized来保证并发更新的安全，底层依然采用数组+链表+红黑树的存储结构。我们可以来看一下他的一些方法来更好的理解它。

一、put方法

public V put(K key, V value) {
    return putVal(key, value, false);
}
 /** Implementation for put and putIfAbsent */
    final V putVal(K key, V value, boolean onlyIfAbsent) {
        if (key == null || value == null) throw new NullPointerException();//key和value不能位null
        int hash = spread(key.hashCode());//拿到hash值
        int binCount = 0;
        for (Node<K,V>[] tab = table;;) {
            Node<K,V> f; int n, i, fh;
            if (tab == null || (n = tab.length) == 0)
                tab = initTable();//初始化数组
            //tabAt(tab, i = (n - 1) & hash)，利用UNSAFE操作拿到tab[i]的值
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {//如果位null
                if (casTabAt(tab, i, null,
                             new Node<K,V>(hash, key, value, null)))//cas操作去给tab[i]的位置new一个Node
                    break;                   // no lock when adding to empty bin
            }
            //static final int MOVED = -1; // hash for forwarding nodes
            else if ((fh = f.hash) == MOVED)//f不等于null才会走这里，看f的哈希值是不是-1
                //等于-1就代表某几个线程正在对ConcurrentHashMap进行扩容
                tab = helpTransfer(tab, f);//然后调用这个方法，去帮助扩容转移元素，转移完成之后，继续循环，拿到新的table
            else {
                V oldVal = null;
                synchronized (f) {//加锁，链表或红黑树的头节点会作为锁的资源
                    if (tabAt(tab, i) == f) {//重新判断一下f是否还是头节点，防止在加锁的过程中f被改变
                        //没有发生变化
                        if (fh >= 0) {//判断hash值是不是大于0，如果是，就表示他是链表上的一个节点，因为红黑树的TreeBin节点的hash为-2
                            binCount = 1;//记录链表节点个数，如果找到key相等的元素，这个值一定小于等于链表的总长度
                            for (Node<K,V> e = f;; ++binCount) {//循环链表
                                K ek;
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {//找到key相等
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)
                                        e.val = value;//覆盖
                                    break;
                                }
                                Node<K,V> pred = e;
                                if ((e = e.next) == null) {//遍历到链表的尾节点
                                    pred.next = new Node<K,V>(hash, key,
                                                              value, null);//尾插法
                                    break;
                                }
                            }
                        }
                        else if (f instanceof TreeBin) {//说明f是树上的一个节点
                            Node<K,V> p;
                            binCount = 2;
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                           value)) != null) {
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                if (binCount != 0) {
                    //TREEIFY_THRESHOLD和树化有关系
                    if (binCount >= TREEIFY_THRESHOLD)//如果小于等于链表长度的binCount大于等于这个值
                        treeifyBin(tab, i);//进行树化
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        addCount(1L, binCount);//size++
        return null;
    }

put方法的底层调用putVal方法实现，加入到内部，我们可以看出ConcurrentHashMap是不允许key或者value为null的，否则会抛出异常。然后就是遍历这个数组了，如果这个数组为空的话，就去初始化这个数组然后接着循环，初始化数组的逻辑我们待会儿研究，如果不为null，就利用(n - 1) & hash去定位到数组的一个位置，如果这个位置上刚好没有元素，用原子性的CAS操作去在这个位置上new一个Node对象，成功的话直接退出循环。如果这个位置有元素，就再去判断这个位置的hash值是不是等于-1，是的话就说明有其他的线程在对这个数组进行一个扩容的操作，那么本线程就去帮助线程进行扩容，helpTransfer方法就是用来做这个工作。如果没有线程存在扩容操作，就去遍历这个位置下的链表或者是红黑树，当然，为了线程安全，要加锁。另外，用一个变量binCount来记录链表节点的个数，如果在遍历的过程中找到key值相同的Node，根据onlyIfAbsent的值去决定是否需要覆盖，如果他是红黑树上的一个节点，就把他插入到红黑树上，当然，如果找到相同key的节点，根据onlyIfAbsent的值去决定是否需要覆盖。最后，去判断binCount的值，如果它不为0，说明put成功，put成功，去判断链表的长度是否需要转换成一个红黑树，然后返回oldValue。循环结束。然后执行addCount方法，看是否需要去扩容。

private final void addCount(long x, int check) {
    	//CounterCell[]，如果有很多CounterCell线程去同时竞争一个baseCount，那么只会有一个成功，其他的线程会去自己对应的CounterCell[]数组的位置上，将CounterCell内部的value值+1，最后计算map的size的时候，会是baseCount + counterCell[i]的value值
        CounterCell[] as; long b, s;
        if ((as = counterCells) != null ||
            !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {//cas操作去修改baseCount的值，cas成功就不会走下面逻辑
            CounterCell a; long v; int m;
            boolean uncontended = true;
            if (as == null || (m = as.length - 1) < 0 ||
                (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
                !(uncontended =
                  U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {//cas操作去把a里面的value+1
                fullAddCount(x, uncontended);//这个方法表示前面判断都没成功，就是没有对CounterCell里面的value+1或者是+1没有成功，这个方法会去+1
                return;
            }
            if (check <= 1)
                return;
            s = sumCount();//拿到size
        }
        if (check >= 0) {
            Node<K,V>[] tab, nt; int n, sc;
            //sizeCtl == 阈值
            //新容量大于当前扩容阈值并且小于最大扩容值才扩容，如果tab=null说明正在初始化，死循环等待初始化完成。
            while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
                   (n = tab.length) < MAXIMUM_CAPACITY) {//对数组进行扩容
                int rs = resizeStamp(n);//对n扩容
                //sc<0表示已经有线程在进行扩容工作
                if (sc < 0) {
                	//条件1：检查是对容量n的扩容，保证sizeCtl与n是一块修改好的
                    //条件2与条件3：应该是进行sc的最小值或最大值判断。
                    //条件4与条件5: 确保tranfer()中的nextTable相关初始化逻辑已走完。
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                        transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))//有新线程参与扩容则sizeCtl加1
                        transfer(tab, nt);//转移
                }
                else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                             (rs << RESIZE_STAMP_SHIFT) + 2))//cas操作将sc改成一个负数
                    transfer(tab, null);//转移
                s = sumCount();
            }
        }
    }

而传入的 x 的值，其实就是为了让ConcurrentHashMap中元素的+1。首先利用cas的操作去改变baseCount的值，如果baseCount的值和BASECOUNT是否相等，因为是多线程的，所以可能会存在不一样的情况，如果一样，那么就将baseCount值改为baseCount + 1，因为x就是1。如果cas没有成功的话，就取到本线程对应的CounterCell对象，cas的方式去将这个对象内部的value+1。然后就是对数组进行扩容了。代码有注释，应该不难看懂。
然后我们再来看一下初始化的方法。

private final Node<K,V>[] initTable() {
        Node<K,V>[] tab; int sc;
        while ((tab = table) == null || tab.length == 0) {
            if ((sc = sizeCtl) < 0)
                //线程让步，只能有一个线程进行初始化
                Thread.yield(); // lost initialization race; just spin
            //cas操作，只能有一个线程使sc-1，这个线程才会执行面的操作
            else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                try {
                    if ((tab = table) == null || tab.length == 0) {//再判断tab是不是null，重检查
                        int n = (sc > 0) ? sc : DEFAULT_CAPACITY;//sc默认是0，所以就会取DEFAULT_CAPACITY = 16
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];//new一个Node数组
                        table = tab = nt;
                        sc = n - (n >>> 2);//0.75：n - n/4 = 3n/4 = 0.75n = 16  * 0.75 = 12
                    }
                } finally {
                    sizeCtl = sc;
                }
                break;
            }
        }
        return tab;
    }

初始化的逻辑比较简单，但是值得注意的是，sc用来判断当前是否有线程在进行初始化，因为在进行初始化的时候，sc会用cas操作改变为-1，所以进入到循环后，首先会判断sc是不是小于0，如果是就进行线程让步，保证只有一个线程在进行初始化。初始化完成后返回tab。

二、size方法

public int size() {
        long n = sumCount();
        return ((n < 0L) ? 0 :
                (n > (long)Integer.MAX_VALUE) ? Integer.MAX_VALUE :
                (int)n);
    }
final long sumCount() {
    //遍历CounterCell数组，把他们累加起来，再加basCount
        CounterCell[] as = counterCells; CounterCell a;
        long sum = baseCount;
        if (as != null) {
            for (int i = 0; i < as.length; ++i) {
                if ((a = as[i]) != null)
                    sum += a.value;
            }
        }
        return sum;//返回元素的个数
    }

size方法的逻辑其实也比较简单，这里会用到我们上面提到的CounterCell数组和一个baseCount变量，他会去遍历CounterCell数组，拿到数组中所有的value值，然后和baseCount累加起来，得到的就是元素的个数。因为我们在操作tab数组的时候，利用的是cas操作去改变baseCount，让他+1，也就是说只有一个线程会改变baseCount，使它+1，其他操作不成功的线程就会去本线程对应的CounterCell数组对应的位置上，让这个CounterCell对象的value值+1，这也就说明了为什么计算size的时候会把CounterCell数组的value值和baseCount累加起来。

三、1.7和1.8的不同

1.JDK8中没有segment分段锁，而是使用synchronized来控制
2.JDK8中的扩容性能更高，支持多线程同时扩容，实际上JDK7也支持多线程扩容，因为7中的扩容是针对每一个Segment，所以也是可以多线程扩容的。但是性能没有JDK8高，因为，JDK8中针对任意一个线程都可以去帮助扩容。
3.JDK8中元素个数的统计的实现也不一样，JDK8中增加了CounterCell数组来帮助计数，而JDK7中没有，JDK7中是put的时候每个Segment内部计数，统计的时候遍历每个Segment对象加锁统计。

沐ぅ阳

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
1.8环境下的ConcurrentHashMap

前言HashMap在高并发的环境下，执行put操作会导致HashMap的Entry链表形成环形数据结构，从而导致Entry的next节点始终不为空，因此产生死循环获取EntryHashTable虽然是线程安全的，但是效率低下，当一个线程访问HashTable的同步方法时，其他线程如果也访问HashTable的同步方法，那么会进入阻塞或者轮训状态。在jdk1.6中ConcurrentHashMap使用锁分段技术提高并发访问效率。首先将数据分成一段一段地存储，然后给每一段数据配一个锁，当一个线
复制链接

扫一扫