ConcurrentHashMap实现原理及源码解析

最新推荐文章于 2024-06-20 14:28:18 发布

遇见更好的自己、

最新推荐文章于 2024-06-20 14:28:18 发布

阅读量329

点赞数

分类专栏： Java基础文章标签： java hashmap

本文链接：https://blog.csdn.net/weixin_44399827/article/details/118582836

版权

Java基础专栏收录该内容

31 篇文章 0 订阅

订阅专栏

我们都知道ConcurrentHashMap是线程安全的HashMap，我们学习之前得搞清楚这样几个问题。

1.为什么HashMap是线程不安全的，在高并发的情况下，会引发什么样的问题。ConcurrentHashMap又是怎么样去解决问题的。

2.ConcurrentHashMap 与HashTable、HashMap之间的区别：同样是线程安全，为什么要选择ConcurrentHashMap而不是HashTable。

首先我们来看第一个问题：

HashMap在1.7的时候线程不安全是指，当并发执行扩容操作时会造成环形链和数据丢失的情况。（1.7的代码不在具体分析：有兴趣的同学可以自行了解。重点看1.8）

JDK1.8中HashMap线程不安全指的是在put的时候，容易出现值覆盖的问题、

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
 }

我们截取HashMap put的部分代码分析。当通过Hash值计算到数组下标的时候，取出对应小标的值，如果为空那么就直接插入。但是当此时有两个线程A,B同时执行到上述代码块。

A执行的时候，检查对应的数组桶的位置，数据为空。去put值进去，然后A的CPU执行时间到了，B执行的时候，数组的桶位置也为空，所以B将值更新进去了，那么A在去put的时候，不在检测是否有值，直接覆盖了B线程的值。这就是1.8中线程不安全的点、

另外，相对于1.8发生线程线程安全的问题带来的影响相对较小。

ConcurrentHashMap与HashTable的比较。HashTable是很早之前为了HashMap在高并发场景下使用而设计的类。直接使用synchronized 将这个容器锁住，多线程的场景下。只能等到上一个线程put值成功，释放锁了以后，才会轮到下一个线程。会有一定的阻塞，造成CPU的浪费。

    public synchronized V put(K key, V value) {
        // Make sure the value is not null
        if (value == null) {
            throw new NullPointerException();
        }
    }

ConcurrentHashMap不同的是：同时是需要通过锁来保证线程安全，但是ConcurrentHashMap使用的锁的力度更小。性能更优。所以我们在日常开放过程，单线程的容器就使用HashMap，多线程的场景下就使用ConcurrentHashMap来保证线程安全。

在1.8之前。ConcurrentHashMap使用的分段锁的手段来实现。数据结构为hashmap（数组加链表）的基础上再套一层segment数组，锁加在segment元素上。1.8中实现了粒度更细的加锁，去掉了segment数组，直接使用synchronized锁住hash后得到的数组下标位置中的第一个元素 ，如下图，这样加锁比segment加锁能支持更高的并发量。

ConcurrentHashMap的get方法的很高效的、读操作是不需要加锁的，及时的高并发的场景下。多个线程也可以同时读同一个key值得value值。接下来我们重点看下。ConcurrentHashMap1.8中的put方法时如果保证线程安全的。

   public V put(K key, V value) {
        return putVal(key, value, false);
    }

    /** Implementation for put and putIfAbsent */
    final V putVal(K key, V value, boolean onlyIfAbsent) {
        if (key == null || value == null) throw new NullPointerException();
        int hash = spread(key.hashCode()); // 获取key的hash值
        int binCount = 0;
        for (Node<K,V>[] tab = table;;) {
            Node<K,V> f; int n, i, fh;
             // 如果table为空 初始化table
            if (tab == null || (n = tab.length) == 0)
                tab = initTable();
             //如果通过Hash值获取到桶的位置的数据为空。那么插入数据
         // Tabat方法通过Volatile保证读取数据的原子性。
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
                //通过CAS判断tab桶位置的数据 预期是否为null，如果是，插入一个新的节点、
                if (casTabAt(tab, i, null,
                             new Node<K,V>(hash, key, value, null)))
                    break;                   // no lock when adding to empty bin
            }
            // 判断是否在插入的过程中，table正在扩容
            else if ((fh = f.hash) == MOVED)
                tab = helpTransfer(tab, f);
            else {
                V oldVal = null;

                //锁住桶位置上第一个节点。
                synchronized (f) {
                    if (tabAt(tab, i) == f) {
                        if (fh >= 0) {
                            binCount = 1;
                            for (Node<K,V> e = f;; ++binCount) {
                                K ek;
                                 //判断是否为相同的key值，是的话，就覆盖原值、
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)
                                        e.val = value;
                                    break;
                                }
                              // 如果不是那么就找到链表的尾部位置插入新的节点、
                                Node<K,V> pred = e;
                                if ((e = e.next) == null) {
                                    pred.next = new Node<K,V>(hash, key,
                                                              value, null);
                                    break;
                                }
                            }
                        }
                        // 如果是红黑树结构的话
                        else if (f instanceof TreeBin) {
                            Node<K,V> p;
                            binCount = 2; 
                             //在数中插入对应的节点、
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                           value)) != null) {
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                if (binCount != 0) {
                   // 如果node数量大于8那么就升级为红黑树。
                    if (binCount >= TREEIFY_THRESHOLD)
                        treeifyBin(tab, i);
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        addCount(1L, binCount);
        return null;
    }

首先我们看到hash算法就不太一样，我们之前了解到HashMap的Hash算法是对key进行hash。然后用hash值与高16位进行异或，得到真正的hash值。具体的了解可以看我之前的博文：

https://blog.csdn.net/weixin_44399827/article/details/118499097

concurrentHashMap 更复杂，使得key值得hash值更加散列    
static final int spread(int h) {
        return (h ^ (h >>> 16)) & HASH_BITS;
    }

    static final int HASH_BITS = 0x7fffffff; // usable bits of normal node hash

接下来我们来看下helpTransfer方法：

final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
        Node<K,V>[] nextTab; int sc;
        //如果table不为空并且该下标的第一个node为ForwardingNode（ForwardingNode是一个代表扩容完毕的特殊node）
        // 并且存储扩容后数据的nextTable不为空
        if (tab != null && (f instanceof ForwardingNode) &&
                (nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
            int rs = resizeStamp(tab.length);
            while (nextTab == nextTable && table == tab &&
                    (sc = sizeCtl) < 0) {
                //扩容结束，跳出循环不参与扩容
                if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || transferIndex <= 0)
                    break;
                if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {
                    //扩容
                    transfer(tab, nextTab);
                    break;
                }
            }
            //返回扩容后的table，供上层方法使用
            return nextTab;
        }
        return table;
    }

最重要的扩容方法transfer：

private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
        int n = tab.length, stride;
        //根据cpu核数计算出步长，用于分割扩容任务，方便其余线程帮助扩容，最小为16
        if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
            stride = MIN_TRANSFER_STRIDE;
        //判断nextTab是否为空，nextTab是暂时存储扩容后的node的数组，第一次进入这个方法的线程才会发现nextTab为空
        //前文提到的helpTransfer也会调用该方法，当helpTransfer调用该方法时nextTab不为空
        if (nextTab == null) {
            try {
                @SuppressWarnings("unchecked")
                //初始化nextTab为table长度的2倍
                Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
                nextTab = nt;
            } catch (Throwable ex) {
                //如果发生了异常，则将sizeCtl设为integer的最大值，因为前文提过数组长度大于1<<30时就不能再扩容了
                sizeCtl = Integer.MAX_VALUE;
                return;
            }
            nextTable = nextTab;
            //将transferIndex赋值为原数组table的长度
            transferIndex = n;
        }
        int nextn = nextTab.length;
        ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
        boolean advance = true;
        boolean finishing = false; 
        //这个for循环就是用来扩容最主要的方法了
       
        for (int i = 0, bound = 0;;) {
            Node<K,V> f; int fh;
            //该while循环的作用有两点 1.将扩容任务根据步长分块  2.确定本次循环要rehash的下标节点（rehash与扩容意义相同）
            while (advance) {
                int nextIndex, nextBound;
                //i为要进行rehash的下标，bound为分块任务的边界，finishing代表扩容完毕
                //每个线程在第一次进行该if判断时，bound和i都为0，finishing为false，不进第一个if
                //在第一个else if时将transferIndex赋值给nextIndex，不进第一个else if
                //在第二个else if，将transferIndex更新为nextIndex－stride
                //假设nextIndex为32，stride为16。代表数组长度32，有32个下标要倒序依次rehash，则任务分为两块（32-16，16-0）
                //第一个线程会处理32-16的任务。
                //第二个线程来的时候发现transferIndex为16，根据步长他会处理16-0的任务
                //如果没有其余的线程帮助扩容，则第一个线程会再完成第一块任务后，再获取下一块任务直至都rehash完
                if (--i >= bound || finishing)
                    advance = false;
                else if ((nextIndex = transferIndex) <= 0) {
                    i = -1;
                    advance = false;
                }
                else if (U.compareAndSwapInt
                        (this, TRANSFERINDEX, nextIndex,
                                nextBound = (nextIndex > stride ?
                                        nextIndex - stride : 0))) {
                    bound = nextBound;
                    i = nextIndex - 1;
                    advance = false;
                }
            }
            //在rehash任务都处理完之前不会进入该if判断,该if方法会进入两次
            if (i < 0 || i >= n || i + n >= nextn) {
                int sc;
                //第一次进入的时候finishing为false
                //第二次进入的时候finishing为true，代表扩容已经结束，将新的nextTab赋值给table，并将sizeCtl设置为table长度的0.75倍
                if (finishing) {
                    nextTable = null;
                    table = nextTab;
                    sizeCtl = (n << 1) - (n >>> 1);
                    return;
                }
                //第一次进入的时候，会将finishing设置为true，并将i重新赋值为原table大小
                //假如n＝32，则会将最外面的for循环再循环32遍检查各个下标作为是否都已经扩容过了
                if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                    if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                        return;
                    finishing = advance = true;
                    i = n;
                }
            }
            //如果该下标内没有数据，则将该下标内放入ForwardingNode，代表该下标rehash结束
            else if ((f = tabAt(tab, i)) == null)
                advance = casTabAt(tab, i, null, fwd);
            //如果该下标的hash值为－1（即ForwardingNode的hash值），代表已经rehash结束，继续下一次循环
            else if ((fh = f.hash) == MOVED)
                advance = true; 
            else {
                //真正的扩容，锁住该下标的第一个node
                synchronized (f) {
                    //再次判断该node有没有变
                    if (tabAt(tab, i) == f) {
                        Node<K,V> ln, hn;
                        //如果该node的hash值>=0, 代表该下标内是链表
                        if (fh >= 0) {
                            int runBit = fh & n;
                            Node<K,V> lastRun = f;
                            
                            for (Node<K,V> p = f.next; p != null; p = p.next) {
                                int b = p.hash & n;
                                if (b != runBit) {
                                    runBit = b;
                                    lastRun = p;
                                }
                            }
                            if (runBit == 0) {
                                ln = lastRun;
                                hn = null;
                            }
                            else {
                                hn = lastRun;
                                ln = null;
                            }
                            //遍历链表，将链表内的node重新分配到新nextTab的i位置和i+n位置
                            //原始的链表会倒序分到两个下标内，越靠后的node在新的map的链表里越靠前
                            for (Node<K,V> p = f; p != lastRun; p = p.next) {
                                int ph = p.hash; K pk = p.key; V pv = p.val;
                                if ((ph & n) == 0)
                                    ln = new Node<K,V>(ph, pk, pv, ln);
                                else
                                    hn = new Node<K,V>(ph, pk, pv, hn);
                            }
                            //更新新的nextTab，并将原table的该下标位置放入ForwardingNode
                            setTabAt(nextTab, i, ln);
                            setTabAt(nextTab, i + n, hn);
                            setTabAt(tab, i, fwd);
                            advance = true;
                        }
                        //该下标内是红黑树
                        else if (f instanceof TreeBin) {
                            TreeBin<K,V> t = (ConcurrentHashMap.TreeBin<K,V>)f;
                            TreeNode<K,V> lo = null, loTail = null;
                            TreeNode<K,V> hi = null, hiTail = null;
                            int lc = 0, hc = 0;
                            //将原树rehash到两个新树里
                            for (Node<K,V> e = t.first; e != null; e = e.next) {
                                int h = e.hash;
                                TreeNode<K,V> p = new TreeNode<K,V>
                                        (h, e.key, e.val, null, null);
                                if ((h & n) == 0) {
                                    if ((p.prev = loTail) == null)
                                        lo = p;
                                    else
                                        loTail.next = p;
                                    loTail = p;
                                    ++lc;
                                }
                                else {
                                    if ((p.prev = hiTail) == null)
                                        hi = p;
                                    else
                                        hiTail.next = p;
                                    hiTail = p;
                                    ++hc;
                                }
                            }
                            //如果树的node数量<=6，则将红黑树变为链表
                            ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                                    (hc != 0) ? new TreeBin<K,V>(lo) : t;
                            hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                                    (lc != 0) ? new TreeBin<K,V>(hi) : t;
                            //将新树或链表放到新的table对应的下标里
                            //并将原table的该下标位置放入ForwardingNode
                            setTabAt(nextTab, i, ln);
                            setTabAt(nextTab, i + n, hn);
                            setTabAt(tab, i, fwd);
                            advance = true;
                        }
                    }
                }
            }
        }
    }

最后的扩容方法参考的博文：有点难理解，有兴趣的同学可以认真看完分析：

参考文献：

https://blog.csdn.net/ddxd0406/article/details/81389583

遇见更好的自己、

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ConcurrentHashMap实现原理及源码解析

我们都知道ConcurrentHashMap是线程安全的HashMap，我们学习之前得搞清楚这样几个问题。1.为什么HashMap是线程不安全的，在高并发的情况下，会引发什么样的问题。ConcurrentHashMap又是怎么样去解决问题的。2.ConcurrentHashMap 与HashTable、HashMap之间的区别：同样是线程安全，为什么要选择ConcurrentHashMap而不是HashTable。首先我们来看第一个问题：HashMap在1.7的时候线程不安全是指，当并发..
复制链接

扫一扫

专栏目录