ConcurrentHashMap实现原理及源码分析

最新推荐文章于 2024-02-01 20:45:00 发布

小白鼠捉大猫咪

最新推荐文章于 2024-02-01 20:45:00 发布

阅读量92

点赞数

分类专栏：集合文章标签： java 数据结构

本文链接：https://blog.csdn.net/qq_36770957/article/details/117417820

版权

集合专栏收录该内容

6 篇文章 0 订阅

订阅专栏

一、ConcurrentHashMap跟HashMap，HashTable的对比

1、 HashMap不是线程安全：
在并发环境下，可能会形成环状链表（扩容时可能造成，具体原因自行百度google或查看源码分析），导致get操作时，cpu空转，所以，在并发环境中使用HashMap是非常危险的。
2、HashTable是线程安全的：
HashTable和HashMap的底层实现原理几乎一致。主要的区别在于HashTable中的键值对都不允许为null，而HashMap中允许键值对为null。除此之外，HashTable属于线程安全的，而HashMap线程不安全。
HashTable实现线程安全的策略代价比较大，每次对底层的数组进行访问时都会对这个数组进行加上一个排它锁，使用关键字synchronized实现的。因此在高并发的场景下，HashTable的并发效率十分低下，一个线程在进行底层数组的操作时，其他的线程只能被阻塞。因此在实际的开发中都是采用ConcurrentHashMap进行多线程开发。
3. ConcurrentHashMap是线程安全的
JDK1.7版本：容器中有多把锁，每一把锁锁一段数据，这样在多线程访问的是不同段的数据时，就不会存在锁竞争了，这样便可以有效地提高并发效率。这就是ConcurrentHashMap所采用的"分段锁"思想，见下图：
在这里插入图片描述
分段锁的机制实际上就将底层的数组看成多个数组段，每个数组段共享一把锁，这样将锁进行细粒度的划分，可以提高并发的效率。
4、jdk8之后，做了修改：
（1）取消segments字段，直接采用transient volatile HashEntry<K,V>[] table保存数据，采用table数组元素作为锁，从而实现了对每一行数据进行加锁，并发控制使用Synchronized和CAS来操作
（2）将原先table数组＋单向链表的数据结构，变更为table数组＋单向链表＋红黑树的结构.

二、ConcurrentHashMap源码分析

1、ConcurrentHashMap底层实现结构
和HashMap一样，在jdk7采用的是数组+链表实现，在jdk8之后采用的是数组+链表+红黑树实现

2、底层定义的基本属性及作用说明

// node数组最大容量：2^30=1073741824
private static final int MAXIMUM_CAPACITY = 1 << 30;
// 默认初始值，必须是2的幕数
private static final int DEFAULT_CAPACITY = 16;
//数组可能最大值，需要与toArray（）相关方法关联
static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
//并发级别，遗留下来的，为兼容以前的版本
private static final int DEFAULT_CONCURRENCY_LEVEL = 16;
// 负载因子，默认为0.75，这个值不用纠结为什么是0.75，这是通过概率统计得到的值
private static final float LOAD_FACTOR = 0.75f;
// 链表转红黑树阀值,> 8 链表转换为红黑树，同样通过概率统计得到的
static final int TREEIFY_THRESHOLD = 8;
//树转链表阀值，小于等于6（tranfer时，lc、hc=0两个计数器分别++记录原bin、新binTreeNode数量，<=UNTREEIFY_THRESHOLD 则untreeify(lo)）
static final int UNTREEIFY_THRESHOLD = 6;
//表示需要进行树化，map中键值对的个数必须大于等于64，如果一个index上的节点数大于了8（树化阈值），
//但是总的节点的个数没有达到64，此时进行数组的扩容，不进行树化，如果大于64，则进行树化，而不是进行数组扩容
static final int MIN_TREEIFY_CAPACITY = 64;
private static final int MIN_TRANSFER_STRIDE = 16;
private static int RESIZE_STAMP_BITS = 16;
// 2^15-1，help resize的最大线程数
private static final int MAX_RESIZERS = (1 << (32 - RESIZE_STAMP_BITS)) - 1;
// 32-16=16，sizeCtl中记录size大小的偏移量
private static final int RESIZE_STAMP_SHIFT = 32 - RESIZE_STAMP_BITS;
// forwarding nodes的hash值
static final int MOVED     = -1;
// 树根节点的hash值
static final int TREEBIN   = -2;
// ReservationNode的hash值
static final int RESERVED  = -3;
// 可用处理器数量
static final int NCPU = Runtime.getRuntime().availableProcessors();
//存放node的数组
transient volatile Node<K,V>[] table;
/*控制标识符，用来控制table的初始化和扩容的操作，不同的值有不同的含义
 *当为负数时：-1代表正在初始化，-N代表有N-1个线程正在 进行扩容
 *当为0时：代表当时的table还没有被初始化
 *当为正数时：表示初始化或者下一次进行扩容的大小*/
private transient volatile int sizeCtl;

3、ConcurrentHashMap添加键值对的源码分析

 final V putVal(K key, V value, boolean onlyIfAbsent) {
        if (key == null || value == null) throw new NullPointerException();//K,V都不能为空，否则的话跑出异常
        int hash = spread(key.hashCode());    //取得key的hash值
        int binCount = 0;    //用来计算在这个节点总共有多少个元素，用来控制扩容或者转移为树
        for (Node<K,V>[] tab = table;;) {    //
            Node<K,V> f; int n, i, fh;
            if (tab == null || (n = tab.length) == 0)    
                tab = initTable();    //第一次put的时候table没有初始化，则初始化table
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {    //通过哈希计算出一个表中的位置因为n是数组的长度，所以(n-1)&hash肯定不会出现数组越界
                if (casTabAt(tab, i, null,        //如果这个位置没有元素的话，则通过cas的方式尝试添加，注意这个时候是没有加锁的
                             new Node<K,V>(hash, key, value, null)))        //创建一个Node添加到数组中区，null表示的是下一个节点为空
                    break;                   // no lock when adding to empty bin
            }
            /*
             * 如果检测到某个节点的hash值是MOVED，则表示正在进行数组扩张的数据复制阶段，
             * 则当前线程也会参与去复制，通过允许多线程复制的功能，一次来减少数组的复制所带来的性能损失
             */
            else if ((fh = f.hash) == MOVED)    
                tab = helpTransfer(tab, f);
            else {
                /*
                 * 如果在这个位置有元素的话，就采用synchronized的方式加锁，
                 *     如果是链表的话(hash大于0)，就对这个链表的所有元素进行遍历，
                 *         如果找到了key和key的hash值都一样的节点，则把它的值替换到
                 *         如果没找到的话，则添加在链表的最后面
                 *  否则，是树的话，则调用putTreeVal方法添加到树中去
                 *  
                 *  在添加完之后，会对该节点上关联的的数目进行判断，
                 *  如果在8个以上的话，则会调用treeifyBin方法，来尝试转化为树，或者是扩容
                 */
                V oldVal = null;
                synchronized (f) {
                    if (tabAt(tab, i) == f) {        //再次取出要存储的位置的元素，跟前面取出来的比较
                        if (fh >= 0) {                //取出来的元素的hash值大于0，当转换为树之后，hash值为-2
                            binCount = 1;            
                            for (Node<K,V> e = f;; ++binCount) {    //遍历这个链表
                                K ek;
                                if (e.hash == hash &&        //要存的元素的hash，key跟要存储的位置的节点的相同的时候，替换掉该节点的value即可
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)        //当使用putIfAbsent的时候，只有在这个key没有设置值得时候才设置
                                        e.val = value;
                                    break;
                                }
                                Node<K,V> pred = e;
                                if ((e = e.next) == null) {    //如果不是同样的hash，同样的key的时候，则判断该节点的下一个节点是否为空，
                                    pred.next = new Node<K,V>(hash, key,        //为空的话把这个要加入的节点设置为当前节点的下一个节点
                                                              value, null);
                                    break;
                                }
                            }
                        }
                        else if (f instanceof TreeBin) {    //表示已经转化成红黑树类型了
                            Node<K,V> p;
                            binCount = 2;
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,    //调用putTreeVal方法，将该元素添加到树中去
                                                           value)) != null) {
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                if (binCount != 0) {
                    if (binCount >= TREEIFY_THRESHOLD)    //当在同一个节点的数目达到8个的时候，则扩张数组或将给节点的数据转为tree
                        treeifyBin(tab, i);    
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        addCount(1L, binCount);    //计数
        return null;
    }

源码说明：

添加一对键值对的时候，首先会去判断保存这些键值对的数组是不是初始化了；
如果没有初始化就先调用initTable（）方法来进行初始化过程
然后通过计算hash值来确定放在数组的哪个位置
** 如果没有hash冲突就直接CAS插入，如果hash冲突的话，则取出这个节点来*
如果取出来的节点的hash值是MOVED(-1)的话，则表示当前正在对这个数组进行扩容，复制到新的数组，则当前线程也去帮助复制
最后一种情况就是，如果这个节点，不为空，也不在扩容，则通过synchronized来加锁，进行添加操作
然后判断当前取出的节点位置存放的是链表还是树
如果是链表的话，则遍历整个链表，直到取出来的节点的key来个要放的key进行比较，如果key相等，则说明是同一个key，则覆盖掉value，否则的话则添加到链表的末尾
如果是树的话，则调用putTreeVal方法把这个元素添加到树中去
最后在添加完成之后，调用addCount（）方法统计size，判断在该节点处共有多少个节点（注意是添加前的个数），如果达到8个以上了的话，
则调用treeifyBin方法来尝试将处的链表转为树，或者扩容数组
4、ConcurrentHashMap的同步机制
（1）读操作：在get操作中，没有使用同步机制，也没有使用unsafe方法，所以读操作是支持并发操作的。
（2）扩容的时候，可以不可以对数组进行读写操作
答：事实上是可以的。当在进行数组扩容的时候，如果当前节点还没有被处理（也就是说还没有设置为fwd节点），那就可以进行设置操作。如果该节点已经被处理了，则当前线程也会加入到扩容的操作中去。
（3）多个线程又是如何同步处理的
通过Synchronized同步机制实现

小白鼠捉大猫咪

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ConcurrentHashMap实现原理及源码分析

一、ConcurrentHashMap跟HashMap，HashTable的对比1、 HashMap不是线程安全：在并发环境下，可能会形成环状链表（扩容时可能造成，具体原因自行百度google或查看源码分析），导致get操作时，cpu空转，所以，在并发环境中使用HashMap是非常危险的。2、HashTable是线程安全的：HashTable和HashMap的底层实现原理几乎一致。主要的区别在于HashTable中的键值对都不允许为null，而HashMap中允许键值对为null。除此之外，Hash
复制链接

扫一扫

专栏目录