构建高性能队列，你不得不知道的底层知识！

最新推荐文章于 2023-02-02 10:54:33 发布

tangtong1

最新推荐文章于 2023-02-02 10:54:33 发布

阅读量353

点赞数

分类专栏：数据结构文章标签：数据结构 java 队列算法 Unsafe

本文链接：https://blog.csdn.net/tangtong1/article/details/108016235

版权

前言

本文收录于专辑：http://dwz.win/HjK，点击解锁更多数据结构与算法的知识。

你好，我是彤哥。

上一节，我们一起学习了如何将递归改写为非递归，其中，用到的数据结构主要是栈。

栈和队列，可以说是除了数组和链表之外最基础的数据结构了，在很多场景中都有用到，后面我们也会陆陆续续的看到。

今天，我想介绍一下，在Java中，如何构建一个高性能的队列，以及我们需要掌握的底层知识。

学习其他语言的同学，也可以看看，在你的语言中，是如何构建高性能队列的。

队列

队列，是一种先进先出（First In First Out，FIFO）的数据结构，类似于实际生活场景中的排队，先到的人先得。

file

使用数组和链表实现简单的队列，我们前面都介绍过了，这里就不再赘述了，有兴趣的同学可以点击以下链接查看：

重温四大基础数据结构：数组、链表、队列和栈

今天我们主要来学习如何实现高性能的队列。

说起高性能的队列，当然是说在高并发环境下也能够工作得很好的队列，这里的很好主要是指两个方面：并发安全、性能好。

并发安全的队列

在Java中，默认地，也自带了一些并发安全的队列：

队列	有界性	锁	数据结构
ArrayBlockingQueue	有界	加锁	数组
LinkedBlockingQueue	可选有界	加锁	链表
ConcurrentLinkedQueue	无界	无锁	链表
SynchronousQueue	无界	无锁	队列或栈
LinkedTransferQueue	无界	无锁	链表
~~PriorityBlockingQueue~~	无界	加锁	堆
~~DelayQueue~~	无界	加锁	堆

这些队列的源码解析快捷入口：死磕 Java并发集合之终结篇

总结起来，实现并发安全队列的数据结构主要有：数组、链表和堆，堆主要用于实现优先级队列，不具备通用性，暂且不讨论。

从有界性来看，只有ArrayBlockingQueue和LinkedBlockingQueue可以实现有界队列，其它的都是无界队列。

从加锁来看，ArrayBlockingQueue和LinkedBlockingQueue都采用了加锁的方式，其它的都是采用的CAS这种无锁的技术实现的。

从安全性的角度来说，我们一般都要选择有界队列，防止生产者速度过快导致内存溢出。

从性能的角度来说，我们一般要考虑无锁的方式，减少线程上下文切换带来的性能损耗。

从JVM的角度来说，我们一般选择数组的实现方式，因为链表会频繁的增删节点，导致频繁的垃圾回收，这也是一种性能损耗。

所以，最佳的选择就是：数组 + 有界 + 无锁。

而JDK并没有提供这样的队列，因此，很多开源框架都自己实现了高性能的队列，比如Disruptor，以及Netty中使用的jctools。

高性能队列

我们这里不讨论具体的某一个框架，只介绍实现高性能队列的通用技术，并自己实现一个。

环形数组

通过上面的讨论，我们知道实现高性能队列使用的数据结构只能是数组，而数组实现队列，必然要使用到环形数组。

环形数组，一般通过设置两个指针实现：putIndex和takeIndex，或者叫writeIndex和readIndex，一个用于写，一个用于读。

file

当写指针到达数组尾端时，会从头开始，当然，不能越过读指针，同理，读指针到达数组尾端时，也会从头开始，当然，不能读取未写入的数据。

file

而为了防止写指针和读指针重叠的时候，无法分清队列到底是满了还是空的状态，一般会再添加一个size字段：

file

所以，使用环形数组实现队列的数据结构一般为：

public class ArrayQueue<T> {
   
    private T[] array;
    private long wrtieIndex;
    private long readIndex;
    private long size;
}

在单线程的情况下，这样不会有任何问题，但是，在多线程环境中，这样会带来严重的伪共享问题。

伪共享

什么是共享？

在计算机中，有很多存储单元，我们接触最多的就是内存，又叫做主内存，此外，CPU还有三级缓存：L1、L2、L3，L1最贴近CPU，当然，它的存储空间也很小，L2比L1稍大一些，L3最大，可以同时缓存多个核心的数据。CPU取数据的时候，先从L1缓存中读取，如果没有再从L2缓存中读取，如果没有再从L3中读取，如果三级缓存都没有，最后会从内存中读取。离CPU核心越远，则相对的耗时就越长，所以，如果要做一些很频繁的操作，要尽量保证数据缓存在L1中，这样能极大地提高性能。

file

缓存行

而数据在三级缓存中，也不是说来一个数据缓存一下，而是一次缓存一批数据，这一批数据又称作缓存行（Cache Line），通常为64字节。

file

每一次，当CPU去内存中拿数据的时候，都会把它后面的数据一并拿过来（组成64字节），我们以long型数组为例，当CPU取数组中一个long的时候，同时会把后续的7个long一起取到缓存行中。

file

这在一定程度上能够加快数据的处理，因为，此时在处理下标为0的数据，下一个时刻可能就要处理下标为1的数据了，直接从缓存中取要快很多。

但是，这样又带来了一个新的问题——伪共享。

伪共享

试想一下，两个线程（CPU）同时在处理这个数组中的数据，两个CPU都缓存了，一个CPU在对array[0]的数据加1，另一个CPU在对array[1]的数据加1，那么，回写到主内存的时候，到底以哪个缓存行的数据为准（写回主内存的时候也是以缓存行的形式写回），所以，此时，就需要对这两个缓存行“加锁”了，一个CPU先修改数据，写回主内存，另一个CPU才能读取数据并修改数据，再写回主内存，这样势必会带来性能的损耗，出现的这种现象就叫做伪共享，这种“加锁”的方式叫做内存屏障，关于内存屏障的知识我们就不展开叙述了。

那么，怎么解决伪共享带来的问题呢？

以环形数组实现的队列为例，writeIndex、readIndex、size现在是这样处理的：