JAVA面试题05-ConcurrentHashMap的实现

最新推荐文章于 2024-07-18 19:00:35 发布

tom_66

最新推荐文章于 2024-07-18 19:00:35 发布

阅读量3.2k

点赞数 1

分类专栏：面试宝典文章标签： java 面试题 HashMap

本文链接：https://blog.csdn.net/fclxyz/article/details/64945960

版权

面试宝典专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1.HashMap是线程安全的么？并发环境下有什么替代方案？

1.1 HashMap不是线程安全。
1.2 并发环境下替代方案有HashTable（所有方法加synchronized）， ConcurrentHashMap（用分段锁实现线程安全）。

2.ConcurrentHashMap是如何实现线程安全的？

2.1 JDK1`.`7中是用Segment（extends ReentrantLock）来实现。

    /**
     * The segments, each of which is a specialized hash table.
     */
    final Segment<K,V>[] segments;//ConcurrentHashMap 有一个Segment数组，也就是说他里面有很多锁

来看看Segment是何方圣神

    //原来就是一把锁
    static final class Segment<K,V> extends ReentrantLock implements Serializable {


        /**
         * The per-segment table. Elements are accessed via
         * entryAt/setEntryAt providing volatile semantics.
         */
        transient volatile HashEntry<K,V>[] table;//这里的结构就和HashMap 差不多了

来看看怎么put的

    public V put(K key, V value) {
        Segment<K,V> s;
        if (value == null)
            throw new NullPointerException();
        int hash = hash(key);
        int j = (hash >>> segmentShift) & segmentMask;
        if ((s = (Segment<K,V>)UNSAFE.getObject          // nonvolatile; recheck
             (segments, (j << SSHIFT) + SBASE)) == null) //  in ensureSegment
            s = ensureSegment(j);
        return s.put(key, hash, value, false);//哈哈，原来是根据hash获取到元素要放在哪个Segment中，然后调用了Segment的put方法
    }

那看看Segment的put是什么鬼

final V put(K key, int hash, V value, boolean onlyIfAbsent) {
            HashEntry<K,V> node = tryLock() ? null ://重点 先tryLock获取锁
                scanAndLockForPut(key, hash, value);
            V oldValue;
            try {
                HashEntry<K,V>[] tab = table;
                int index = (tab.length - 1) & hash;
                HashEntry<K,V> first = entryAt(tab, index);
                for (HashEntry<K,V> e = first;;) {
                    if (e != null) {
                        K k;
                        if ((k = e.key) == key ||
                            (e.hash == hash && key.equals(k))) {
                            oldValue = e.value;
                            if (!onlyIfAbsent) {
                                e.value = value;
                                ++modCount;
                            }
                            break;
                        }
                        e = e.next;
                    }
                    else {
                        if (node != null)
                            node.setNext(first);
                        else
                            node = new HashEntry<K,V>(hash, key, value, first);
                        int c = count + 1;
                        if (c > threshold && tab.length < MAXIMUM_CAPACITY)
                            rehash(node);
                        else
                            setEntryAt(tab, index, node);
                        ++modCount;
                        count = c;
                        oldValue = null;
                        break;
                    }
                }
            } finally {
                unlock();//重点 释放锁
            }
            return oldValue;
        }

好了，总结一下

JDK1.7中ConcurrentHashMap是用一个二维数组链表来实现的。其实就是一个Segment的数组，每个Segment又是一个数组链表，而且是一个锁，每次对同一个Segment中元素进行写操作的时候，会锁住整个Segment。
那和HashTable比较一下，有什么好处呢？
好处就是，ConcurrentHashMap写操作只会锁一段（锁住Segment中所有元素），对不同Segment元素的操作不会互相阻塞，而HashTable用的是synchronized，会锁住整个对象，相当于一个HashTable上的操作都是并行的，连get方法都会阻塞其他操作。
换个说法吧，一个HashTable只有一把锁，最多只有一个线程获取到锁。
ConcurrentHashMap有很多把锁（比如16），那么此时最多支持16个并发（一个并发一把锁，人人有份，不用抢），当然了，最理想的场景是16个并发操作的Segment都不一样。

2.2 JDK1.8如何实现线程安全的

改进一：取消segments字段，直接采用transient volatile HashEntry<K,V>[] table保存数据，采用table数组元素作为锁，从而实现了对每一行数据进行加锁，进一步减少并发冲突的概率。

改进二：将原先table数组＋单向链表的数据结构，变更为table数组＋单向链表＋红黑树的结构。对于hash表来说，最核心的能力在于将key hash之后能均匀的分布在数组中。如果hash之后散列的很均匀，那么table数组中的每个队列长度主要为0或者1。但实际情况并非总是如此理想，虽然ConcurrentHashMap类默认的加载因子为0.75，但是在数据量过大或者运气不佳的情况下，还是会存在一些队列长度过长的情况，如果还是采用单向列表方式，那么查询某个节点的时间复杂度为O(n)；因此，对于个数超过8(默认值)的列表，jdk1.8中采用了红黑树的结构，那么查询的时间复杂度可以降低到O(logN)，可以改进性能。

为了说明以上2个改动，看一下put操作是如何实现的。

final V putVal(K key, V value, boolean onlyIfAbsent) {
    if (key == null || value == null) throw new NullPointerException();
    int hash = spread(key.hashCode());
    int binCount = 0;
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        // 如果table为空，初始化；否则，根据hash值计算得到数组索引i，如果tab[i]为空，直接新建节点Node即可。注：tab[i]实质为链表或者红黑树的首节点。
        if (tab == null || (n = tab.length) == 0)
            tab = initTable();
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            if (casTabAt(tab, i, null,
                         new Node<K,V>(hash, key, value, null)))
                break;                   // no lock when adding to empty bin
        }
        // 如果tab[i]不为空并且hash值为MOVED，说明该链表正在进行transfer操作，返回扩容完成后的table。
        else if ((fh = f.hash) == MOVED)
            tab = helpTransfer(tab, f);
        else {
            V oldVal = null;
            // 针对首个节点进行加锁操作，而不是segment，进一步减少线程冲突
            synchronized (f) {
                if (tabAt(tab, i) == f) {
                    if (fh >= 0) {
                        binCount = 1;
                        for (Node<K,V> e = f;; ++binCount) {
                            K ek;
                            // 如果在链表中找到值为key的节点e，直接设置e.val = value即可。
                            if (e.hash == hash &&
                                ((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                oldVal = e.val;
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            // 如果没有找到值为key的节点，直接新建Node并加入链表即可。
                            Node<K,V> pred = e;
                            if ((e = e.next) == null) {
                                pred.next = new Node<K,V>(hash, key,
                                                          value, null);
                                break;
                            }
                        }
                    }
                    // 如果首节点为TreeBin类型，说明为红黑树结构，执行putTreeVal操作。
                    else if (f instanceof TreeBin) {
                        Node<K,V> p;
                        binCount = 2;
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                       value)) != null) {
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            if (binCount != 0) {
                // 如果节点数>＝8，那么转换链表结构为红黑树结构。
                if (binCount >= TREEIFY_THRESHOLD)
                    treeifyBin(tab, i);
                if (oldVal != null)
                    return oldVal;
                break;
            }
        }
    }
    // 计数增加1，有可能触发transfer操作(扩容)。
    addCount(1L, binCount);
    return null;
}



时间过得真快，不写这个博客，还不知道1.8改动这么大，逝者如斯夫，不舍昼夜，吾将上下而求索。