深入ConcurrentHashMap二

最新推荐文章于 2023-04-05 16:29:42 发布

剑八-

最新推荐文章于 2023-04-05 16:29:42 发布

阅读量1.4k

点赞数

文章标签：并发 concurrent 高性能线程

本文链接：https://blog.csdn.net/zhaozhenzuo/article/details/37702783

版权

深入ConcurrentHashMap一，已经介绍了基本的ConcurrentHashMap的结构，Segment组成，HashEntry的组成以及包括ConcurrentHashMap的创建。

这篇文章主要关注往ConcurrentHashMap放入元素的情况，即put(K key,V value)方法。

ConcurrentHashMap put进一个key,value的简化的步骤如下：
    1.取key的hash值，算出在存放的Segment数组下标。
    2.找到segment数组下标后，取出这个Segment，然后计算出需要存放在Segment中HashEntry的数组下标
    3.最后将key,value放入

详细步骤如图：

接下去分析源码。首先是获取要存放元素的segment的源码，代码如下：

public V put(K key, V value) {
        Segment<K,V> s;
        if (value == null)
            throw new NullPointerException();
        int hash = hash(key);
        int j = (hash >>> segmentShift) & segmentMask;
        if ((s = (Segment<K,V>)UNSAFE.getObject          // nonvolatile; recheck
             (segments, (j << SSHIFT) + SBASE)) == null) //  in ensureSegment
            s = ensureSegment(j);
        return s.put(key, hash, value, false);
}

这里首先会计算key的hash值，hash(key)方法会尽量打散hash，减少hash冲突。
计算出hash后，会使用语句int j = (hash >>> segmentShift) & segmentMask;　来得到segment数组下标。
然后使用UNSAFE.getObject来尝试从segment数组获取segment。如果为空这时会调用ensureSegment(j)方法创建一个并ＣＡＳ设置到segment数组当中。
由于相对来讲segment只在第一次不存在的时候才会创建并放入segment数组中，也只有在这一步会发生与其它线程的竞争。
因此对于segment的创建及放入到segment数组当中，ConcurrentHashMap采用的是CAS操作，来原子性的放入segment。这也符合对于少量或
中度并发的情形适合用ＣＡＳ操作。

有了segment后，调用segment的put方法将元素插入到相应的HashEntry数组当中。segment的put方法源码如下：

 final V put(K key, int hash, V value, boolean onlyIfAbsent) {
            HashEntry<K,V> node = tryLock() ? null :
                scanAndLockForPut(key, hash, value);
            V oldValue;
            try {
                HashEntry<K,V>[] tab = table;
                int index = (tab.length - 1) & hash;
                HashEntry<K,V> first = entryAt(tab, index);
                for (HashEntry<K,V> e = first;;) {
                    if (e != null) {
                        K k;
                        if ((k = e.key) == key ||
                            (e.hash == hash && key.equals(k))) {
                            oldValue = e.value;
                            if (!onlyIfAbsent) {
                                e.value = value;
                                ++modCount;
                            }
                            break;
                        }
                        e = e.next;
                    }
                    else {
                        if (node != null)
                            node.setNext(first);
                        else
                            node = new HashEntry<K,V>(hash, key, value, first);
                        int c = count + 1;
                        if (c > threshold && tab.length < MAXIMUM_CAPACITY)
                            rehash(node);
                        else
                            setEntryAt(tab, index, node);
                        ++modCount;
                        count = c;
                        oldValue = null;
                        break;
                    }
                }
            } finally {
                unlock();
            }
            return oldValue;
        }

这部分由于对于每个segment的put操作，相对来讲竞争会比较激烈。因此这里会使用lock来进行同步控制。
分以下步骤进行：
１.这里会首先调用ReentrantLock的tryLock方法，看是否能够获取到锁。能则进入到第３步。否则进入第２步，调用scanAndLockForPut获取锁。
２.调用scanAndLockForPut方法尝试获取ＣＡＳ获取锁。进入这个方法时先尝试获取一次，如果获取到则马上返回。否则会进行多次ＣＡＳ获取锁，
在获取锁的过程中如果要放入的元素在HashEntry数组中相应位置不存在则先创建一个。
源码如下：

private HashEntry<K,V> scanAndLockForPut(K key, int hash, V value) {
            HashEntry<K,V> first = entryForHash(this, hash);
            HashEntry<K,V> e = first;
            HashEntry<K,V> node = null;
            int retries = -1; // negative while locating node
            while (!tryLock()) {
                HashEntry<K,V> f; // to recheck first below
                if (retries < 0) {
                    if (e == null) {
                        if (node == null) // speculatively create node
                            node = new HashEntry<K,V>(hash, key, value, null);
                        retries = 0;
                    }
                    else if (key.equals(e.key))
                        retries = 0;
                    else
                        e = e.next;
                }
                else if (++retries > MAX_SCAN_RETRIES) {
                    lock();
                    break;
                }
                else if ((retries & 1) == 0 &&
                         (f = entryForHash(this, hash)) != first) {
                    e = first = f; // re-traverse if entry changed
                    retries = -1;
                }
            }
            return node;
        }

可以看到一旦retries次数如果超过MAX_SCAN_RETRIES(这里是６４次)则会调用ReentrantLock的lock方法阻塞的获取锁（在lock方法中还是会用ＣＡＳ获取锁，如果还是不能获取到
则将此线程放入ＣＬＨ队列，最后阻塞，详细见深入并发AQS二）。
比较有意思的是最后一个
else if ((retries & 1) == 0 &&
(f = entryForHash(this, hash)) != first)
这部分代码，这里判断如果当前HashEntry要存放位置的首结点，如果有其它线程已经完成了插入的操作，则会将retries置为-1。
ConcurrentHashMap认为这种情况之后会很快获取到锁。
一直重复ＣＡＳ获取锁，获取到后返回node。

3.已经获取到锁后，就可以放HashEntry中放入元素了。
这里分两种情况:
一种是当前HashEntry数组相应位置存在这个key元素，这时会将当前HashEntry的value替换成新的value。
一种是当前HashEntry数组相应位置不存在这个key元素，这时则会将元素插入到相应位置。

对于于第一种情况的源码在上述put方法当中，部分片断如下：

try {
                HashEntry<K,V>[] tab = table;
                int index = (tab.length - 1) & hash;
                HashEntry<K,V> first = entryAt(tab, index);
                for (HashEntry<K,V> e = first;;) {
                     if (e != null) {
                        //这里如果e不为空，则说明当前HashEntry位置已经元素在，这时遍历这个冲突链，看是否当前key已经存在于HashEntry当中
                        K k;
                        if ((k = e.key) == key ||
                            (e.hash == hash && key.equals(k))) {
　　　　　　　　　　　　　　　　　　　//当前存在key元素，这时替换它
 　　　　　　　　　　　　　　　　　　oldValue = e.value;
                            if (!onlyIfAbsent) {
                                e.value = value;
                                ++modCount;
                            }
                            break;
                        }
                        e = e.next;
                    }
                    else {
                        //这个分支认为当前位置HashEntry无元素存在或者当前不存在相同key的HashEntry。
　　　　　　　　　　　　　　　//这时如果前面scanAndLockForPut已经返回创建的HashEntry结点，则直接将这个新node结点的next指针指向HashEntry位置的首结点
                        if (node != null)
                            node.setNext(first);
                        else
                        //node为空则新建一个HashEntry，用于存放key，value
                        node = new HashEntry<K,V>(hash, key, value, first);
                        int c = count + 1;
                        if (c > threshold && tab.length < MAXIMUM_CAPACITY)
                            rehash(node);
                        else
                            setEntryAt(tab, index, node);
                        ++modCount;
                        count = c;
                        oldValue = null;
                        break;
                    }
                }
            } finally {
                unlock();
            }

可以看到这里有个优化部分是调用