Java~并发容器ConcurrentHashMap、ConcurrentLinkedQueue、阻塞队列BlockingQueue的实现原理与使用

最新推荐文章于 2021-05-06 16:45:08 发布

Listen-Y

最新推荐文章于 2021-05-06 16:45:08 发布

阅读量635

点赞数 5

分类专栏： Java Java多线程文章标签：队列链表 java 数据结构

本文链接：https://blog.csdn.net/Shangxingya/article/details/109067929

版权

Java 同时被 2 个专栏收录

104 篇文章 11 订阅

订阅专栏

Java多线程

40 篇文章 0 订阅

订阅专栏

文章目录

ConcurrentHashMap对比HashMap和HashTable

在并发编程中使用HashMap可能导致程数据序数据出错严重还会导致死循环。而使用线程安全的HashTable效率又非常低下，基于以上两个原因，便有了ConcurrentHashMap的登场机会.

HashMap在并发执行put操作时会引导致多个数据放到一个位置上造成数据丢失严重还会起死循环，是因为多线程会导致HashMap的数组中的桶链表形成环形数据结构，一旦形成环形数据结构，链表的next节点永远不为空，就会产生死循环获链表中的最后一个节点
HashTable容器使用synchronized来保证线程安全，但在线程竞争激烈的情况下HashTable 的效率非常低下。因为当一个线程访问HashTable的同步方法，其他线程也访问HashTable的同步方法时，会进入阻塞或轮询状态。如线程1使用put进行元素添加，线程2不但不能使用put方法添加元素，也不能使用get方法来获取元素，所以竞争越激烈效率越低。
HashTable容器在竞争激烈的并发环境下表现出效率低下的原因是所有访问HashTable的线程都必须竞争同一把锁，假如容器里有多把锁，每一把锁用于锁容器其中一部分数据，那么当多线程访问容器里不同数据段的数据时，线程间就不会存在锁竞争，从而可以有效提高并发访问效率，这就是ConcurrentHashMap所使用的锁分段技术。首先将数据分成一段一段地存储，然后给每一段数据配一把锁，当一个线程占用锁访问其中一个段数据的时候，其他段的数据也能被其他线程访问。

ConcurrentHashMap的结构原理

ConcurrentHashMap是由Segment数组结构和HashEntry数组结构组成。Segment是一种可重入锁（ReentrantLock），在ConcurrentHashMap里扮演锁的角色；HashEntry则用于存储键值对数据。一个ConcurrentHashMap里包含一个Segment数组。Segment的结构和HashMap类似，是一种数组和链表结构。一个Segment里包含一个HashEntry数组，每个HashEntry是一个链表结构的元素，每个Segment守护着一个HashEntry数组里的元素，当对HashEntry数组的数据进行修改时，必须首先获得与它对应的Segment锁, 也就是使用concurrentHashMap的时候是使用俩次hash函数的使用才可以找到具体的元素.

get操作

Segment的get操作实现非常简单和高效。先经过一次再散列，然后使用这个散列值定位到Segment，再通过散列算法定位到这个Segment里的具体元素.
get操作的高效之处在于整个get过程不需要加锁，除非读到的值是空才会加锁重读。get方法里将要使用的共享变量都定义成volatile类型，如用于统计当前 Segement大小的count字段和用于存储值的HashEntry的value。定义成volatile的变量，能够在线程之间保持可见性，能够被多线程同时读，并且保证不会读到过期的值.
即使两个线程同时修改和获取 volatile变量因为根据Java内存模型的happen before原则，对volatile字段的写入操作先于读操作，get操作也能拿到最新的值，这是用volatile替换锁的经典应用场景。

put操作

由于put方法里需要对共享变量进行写入操作，所以为了线程安全，在操作共享变量时必须加锁。put方法首先定位到Segment获取他的锁，然后在Segment里进行插入操作。插入操作需要经历两个步骤，第一步判断是否需要对Segment里的HashEntry数组进行扩容，第二步定位添加元素的位置，然后将其放在HashEntry数组里。最后释放这个Segment的锁

是否需要扩容

在插入元素前会先判断Segment里的HashEntry数组是否超过容量（threshold），如果超过阈值，则对数组进行扩容。值得一提的是，Segment的扩容判断比HashMap更恰当，因为HashMap 是在插入元素后判断元素是否已经到达容量的，如果到达了就进行扩容，但是很有可能扩容之后没有新元素插入，这时HashMap就进行了一次无效的扩容。

如何扩容

在扩容的时候，首先会创建一个容量是原来容量两倍的数组，然后将原数组里的元素进行再散列后插入到新的数组里。为了高效，ConcurrentHashMap不会对整个容器进行扩容，而只对某个segment进行扩容

size操作

如果要统计整个ConcurrentHashMap里元素的大小，就必须统计所有Segment里元素的大小后求和。Segment里的全局变量count是一个volatile变量，那么在多线程场景下，是不是直接把所Segment的count相加就可以得到整个ConcurrentHashMap大小了呢？不是的，虽然相加时可以获取每Segment的count的最新值，但是可能累加的那个时刻使用的count发生了变化，那么统计结果就不准了。
所以，最安全的做法是在统计size的时候把所有Segment的put、remove和clean方法全部锁住，但是这种做法显然非常低效。因为在累加count操作过程中，之前累加过的count发生变化的几率非常小，所以 ConcurrentHashMap的做法是先尝试2次通过不锁住Segment的方式来统计各个Segment大小，如果统计的过程中，容器的count发生了变化，则再采用加锁的方式来统计所有Segment的大小。
那么ConcurrentHashMap是如何判断在统计的时候容器是否发生了变化呢？使用modCount 变量，在put、remove和clean方法里操作元素前都会将变量modCount进行加1，那么在统计size 前后比较modCount是否发生变化，从而得知容器的大小是否发生变化。

ConcurrentLinkedQueue

实现一个线程安全的队列有两种方式：一种是使用阻塞算法(BlockingQueue)，另一种是使用非阻塞算法。使用阻塞算法的队列可以用一个锁（入队和出队用同一把锁）或两个锁（入队和出队用不同的锁）等方式来实现。非阻塞的实现方式则可以使用循环CAS的方式来实现(ConcurrentLinkedQueue)
ConcurrentLinkedQueue是一个基于链接节点的线程安全队列，它采用先进先出的规则对节点进行排序，当我们添加一个元素的时候，它会添加到队列的尾部；当我们获取一个元素时，它会返回队列头部的元素。它采用了循环CAS算法来实现

ConcurrentLinkedQueue的结构原理

ConcurrentLinkedQueue由head节点和tail节点组成，每个节点（Node）由节点元素（item）和指向下一个节点（next）的引用组成，节点与节点之间就是通过这个next关联起来，从而组成一张链表结构的队列。默认情况下head节点存储的元素为空，tail节点等于head节点。

入队列

入队列就是将入队节点添加到队列的尾部。
多个线程同时进行入队的情况就变得更加复杂了，因为可能会出现其他线程插队的情况。如果有一个线程正在入队，那么它必须先获取尾节点，然后设置尾节点的下一个节点为入队节点，但这时可能有另外一个线程插队了，那么队列的尾节点就会发生变化，这时当前线程要暂停入队操作，然后重新获取尾节点。
循环CSA算法主要体现就是循环找到正确的尾节点进行插入
ConcurrentLinkdeQueue为了减少循环CAS操作带来的消耗就会导致tai指向的节点并不是总是队列的最后一个节点, 也就是tali的更新操作并不是每次插入都执行, 当tial的next为空的时候就直接插入节点并不更新节点, 如果tali的next不为空则插到next的下一个, 然后将tail直接指向这个新的节点就可以, 这样一来我们执行CAS的时候就会有俩种情况出现正确匹配从而减少CAS的循环

出队列

出队列的就是从队列里返回一个第一个数据, 并且将这个数据在队列中删除
出队列和入队列大同小异也是使用循环CAS算法找到正确的头结点才可以进行元素的弹出和删除
为了减少循环CAS的消耗出队列也是导致不是每次出队时都更新head节点，当head节点里有元素时，直接弹出head 节点里的元素，而不会更新head节点。只有当head节点里没有元素时，出队操作才会更新head 节点。这种做法也是来减少使用CAS更新head节点的消耗，从而提高出队效率。

阻塞队列BlockingQueue

阻塞队列（BlockingQueue）是一个特殊支持两个附加操作的队列。这两个附加的操作支持阻塞的插入和阻塞的移除方法。

支持阻塞的插入方法：意思是当队列满时，队列会阻塞插入元素的线程，直到队列不满。
支持阻塞的移除方法：意思是在队列为空时，获取元素的线程会等待队列变为非空。

Java里的六个阻塞队列(了解)

ArrayBlockingQueue是一个用数组实现的有界不公平的阻塞队列。此队列按照先进先出（FIFO）的原则对元素进行排序。默认情况下不保证线程公平的访问队列，所谓公平访问队列是指阻塞的线程，可以按照阻塞的先后顺序访问队列，即先阻塞线程先访问队列。非公平性是对先等待的线程是非公平的，当队列可用时，阻塞的线程都可以争夺访问队列的资格，有可能先阻塞的线程最后才访问队列。
LinkedBlockingQueue是一个用链表实现的有界阻塞队列。此队列的默认和最大长度为 Integer.MAX_VALUE。此队列按照先进先出的原则对元素进行排序。
PriorityBlockingQueue是一个支持优先级的无界阻塞队列。默认情况下元素采取自然顺序升序排列。也可以自定义类实现compareTo()方法来指定元素排序规则，或者初始化 PriorityBlockingQueue时，指定构造参数Comparator来对元素进行排序。需要注意的是不能保证同优先级元素的顺序
DelayQueue是一个支持延时获取元素的无界阻塞队列。队列使用PriorityQueue来实现, 所以在其内部会进行一个排序, 将延迟时间长的放在后面。队列中的元素必须实现Delayed接口，在创建元素时可以指定多久才能从队列中获取当前元素。只有在延迟期满时才能从队列中提取元素
SynchronousQueue是一个不存储元素的阻塞队列。每一个put操作必须等待一个take操作，否则不能继续添加元素。它支持公平访问队列。
LinkedBlockingDeque是一个由链表结构组成的双向阻塞队列。所谓双向队列指的是可以从队列的两端插入和移出元素。双向队列因为多了一个操作队列的入口，在多线程同时入队时，也就减少了一半的竞争。相比其他的阻塞队列，LinkedBlockingDeque多了addFirst、 addLast、offerFirst、offerLast、peekFirst和peekLast等方法，以First单词结尾的方法，表示插入、获取（peek）或移除双端队列的第一个元素。以Last单词结尾的方法，表示插入、获取或移除双端队列的最后一个元素。双向阻塞队列可以运用在“工作窃取”模式中

Listen-Y

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Java~并发容器ConcurrentHashMap、ConcurrentLinkedQueue、阻塞队列BlockingQueue的实现原理与使用

文章目录ConcurrentHashMap对比HashMap和HashTableConcurrentHashMap的结构原理get操作put操作size操作ConcurrentLinkedQueueConcurrentLinkedQueue的结构原理入队列出队列阻塞队列BlockingQueueJava里的六个阻塞队列(了解)ConcurrentHashMap对比HashMap和HashTable在并发编程中使用HashMap可能导致程数据序数据出错严重还会导致死循环。而使用线程安全的HashTabl
复制链接

扫一扫