聊聊ConcurrentHashMap

最新推荐文章于 2024-08-18 16:03:45 发布

会飞的皮卡丘EI

最新推荐文章于 2024-08-18 16:03:45 发布

阅读量1.2k

点赞数 2

分类专栏：多线程

本文链接：https://blog.csdn.net/H_Q_Li/article/details/108827218

版权

多线程专栏收录该内容

12 篇文章 0 订阅

订阅专栏

聊聊ConcurrentHashMap

一、为什么需要ConcurrentHashMap

1、HashMap 线程不安全

在多线程环境下，使用HashMap进行 put 操作的时候可能造成死循环，导致 CPU 使用率太高

为什么HashMap线程不安全?

在 put 的时候，插入元素超过了容量，就会进行rehash，这个会重新将原数组的内容重新hash到新的扩容数组中，在多线程的环境下，存在同时其他的元素也在进行 put 操作，如果 hash 值相同，可能出现同时在同一数组下用链表表示，造成闭环，导致在 get 时会出现死循环，所以不安全

2、HashTable 安全但是效率太低了

因为 HashTable 是利用 synchronized 来保证线程安全的，在线程竞争激烈的情况下效率将会非常低。因为在一个线程访问同步方法的时候，其他线程只能阻塞等待。

二、ConcurrentHashMap 的好处

实现了前面的两个问题：线程安全了并且也解决了HashTable 效率低下的问题

三、怎么解决效率低下的问题

这个主要是运用了分段锁（segment）的思想

HashTable 为什么效率低，就是因为它是多个线程竞争同一把锁，那么如果容器里面有很多把锁，这个问题是不是就可以解决了，这个就是ConcurrentHashMap所使用的分段锁技术。

首先将数据分为一段一段的进程存储，然后给每一段分别加上锁，当一个线程占用锁访问其中一个段的数据的时候，其他段的数据也可以被其他线程访问。

接下来我们就重点讲讲分段锁吧

ConcurrentHashMap 是由Segment 数组结构和HashEntry数组结构组成的。Segment是一种可重入锁ReentrantLock，在 ConcurrentHashMap 里面扮演锁的角色，HashEntry 则是用来村塾键值对数据。一个 ConcurrentHashMap 里面包含一个 Segment数组，Segment的结构和HashMap类似，是一种数组+链表结构，一个Segment里面包含一个 HashEntry数组，每个HashEntry是一个链表节点构成的元素，每个Segment守护一个HashEntry数组里面的元素，当对HashEntry数组的元素进行修改时，必须首先获得它对应的Segment锁。可以说，ConcurrentHashMap是一个二级的哈希表。在一个总的哈希表下面还有若干个子哈希表。

在这里插入图片描述

四、采用分段锁技术的好处：并发的读写

case1：不同Segment的并发写入：

在这里插入图片描述

不同的Segment的写入是可以并发执行的

case 2：同一个Segment 的写
在这里插入图片描述

Segment的写入是需要上锁的，因此对同一个Segment的并发写会被阻塞

case 3：同一个Segment 的写-读

同一个Segment的写-读是可以并发执行的

五、详细看看读-写的过程

1、读：Get()

为输入的Key做 Hash 运算，得到 hash 值
通过 hash 值，定位到对应的Segment 对象
再次通过 hash 值，定位到 Segment 当中数组的具体位置

读操作其实是没有锁的，第一次通过 hash 定位到 Segment 上，第二次通过 hash 定位到具体元素上。因为 hashEntry 中的 value 属性是用 volatile 修饰的，保证了可见性，所以每次获取的都死最新值。

2、写：Put()

为输入的 Key 做 Hash 运算，得到 hash 值
通过 hash 值，定位到对应的 Segment 对象
获取可重入锁
再次通过 hash 值，定位到 Segment 当中数组的具体位置
插入或覆盖 HashEntry 对象
释放锁

总结：可以看出ConcurrentHashMap在读写的时候都需要两次定位。首先是定位到 Segment ，然后再定位到 Segment 下的具体的数组下标

六、size() 怎么解决一致性问题

size()目的是统计ConcurrentHashMap的总元素数量，自然需要把各个Segment 内部的元素都加起来。但是在统计数量的时候，有可能已经统计过的Segment顺佳插入了新的元素，这个时候应该怎么办？下面我们来看看ConcurrentHashMap的size()，他是一个嵌套循环，大致逻辑如下：