ConcurrentHashMap源码深度解析（一）（java8）—

最新推荐文章于 2024-05-16 10:23:10 发布

2401_84023920

最新推荐文章于 2024-05-16 10:23:10 发布

阅读量770

点赞数 29

分类专栏：程序员文章标签： java 网络前端

本文链接：https://blog.csdn.net/2401_84023920/article/details/138275563

版权

程序员专栏收录该内容

201 篇文章 0 订阅

订阅专栏

/**

The load factor for this table. Overrides of this value in
constructors affect only the initial table capacity. The
actual floating point value isn’t normally used – it is
simpler to use expressions such as {@code n - (n >>> 2)} for
the associated resizing threshold.
默认扩容因子，但是用不上。

private static final float LOAD_FACTOR = 0.75f;

/**

The bin count threshold for using a tree rather than list for a
bin. Bins are converted to trees when adding an element to a
bin with at least this many nodes. The value must be greater
than 2, and should be at least 8 to mesh with assumptions in
tree removal about conversion back to plain bins upon
shrinkage.
链表转为红黑树的阈值，>= TREEIFY_THRESHOLD链表可能转为红黑树

static final int TREEIFY_THRESHOLD = 8;

/**

The bin count threshold for untreeifying a (split) bin during a
resize operation. Should be less than TREEIFY_THRESHOLD, and at
most 6 to mesh with shrinkage detection under removal.
红黑树转为链表的阈值， <= UNTREEIFY_THRESHOLD 时红黑树转为链表，只作用于扩容阶段

static final int UNTREEIFY_THRESHOLD = 6;

/**

容量在64以内，即使达到链表转红黑树的阈值也不转换，而是扩容
The smallest table capacity for which bins may be treeified.
(Otherwise the table is resized if too many nodes in a bin.)
The value should be at least 4 * TREEIFY_THRESHOLD to avoid
conflicts between resizing and treeification thresholds.

static final int MIN_TREEIFY_CAPACITY = 64;

/**

Minimum number of rebinnings per transfer step. Ranges are
subdivided to allow multiple resizer threads. This value
serves as a lower bound to avoid resizers encountering
excessive memory contention. The value should be at least
DEFAULT_CAPACITY.
扩容时，给线程分配迁移数组元素任务时的最小步长

private static final int MIN_TRANSFER_STRIDE = 16;

/**

The number of bits used for generation stamp in sizeCtl.
Must be at least 6 for 32bit arrays.
扩容时，在sizeCtl中用于生成戳记的数值

private static int RESIZE_STAMP_BITS = 16;

/**

The maximum number of threads that can help resize.
Must fit in 32 - RESIZE_STAMP_BITS bits.
帮助扩容的最大线程数

private static final int MAX_RESIZERS = (1 << (32 - RESIZE_STAMP_BITS)) - 1;

/**

The bit shift for recording size stamp in sizeCtl.
在sizeCtl中用于生成记录扩容线程个数的戳记的移位数

private static final int RESIZE_STAMP_SHIFT = 32 - RESIZE_STAMP_BITS;

// MOVED=-1 代表数组正在扩容，forwarding nodes的hash=-1

// hash for forwarding nodes

static final int MOVED = -1;

// 用于标记红黑树根节点的hash

static final int TREEBIN = -2; // hash for roots of trees

// 在computeIfAbsent and compute中用到可以先不用管

static final int RESERVED = -3; // hash for transient reservations

// 正常hash值的可用位,在spread中用于保证计算的hash值不超过HASH_BITS

// 2147483647

// 1111 1111 1111 1111 1111 1111 1111 111

static final int HASH_BITS = 0x7fffffff; // usable bits of normal node hash

2、基本属性

有些基本属性也需要预先了解下，后期读源码时才会更顺利一些：

table，代表当前数组。
nextTable，扩容后的新数组，只有在数组扩容时不为null。若get操作时，在旧数组table找不到节点，对应位置上又有转发节点时，会将get操作转发到nextTable。
transferIndex，记录了扩容任务分配的进度。初始为n，逆序扩容，每次减一个步长的位置，最终减至＜=0，表示整个扩容任务分配完了。
baseCount，数组元素基础计数，在没有竞争的时候先cas修改baseCount。
CounterCell[] counterCells，当cas修改baseCount失败后的线程会去修改对应counterCells数组中一个计数格子。所以想获取数组内元素的总个数就是baseCount+counterCells数组内所有计数格记录值之和。
cellsBusy，简易自旋锁，用于counterCells数组中保证多线程更新数组元素个数线程安全。

sizeCtl的定义较为复杂，但是很重要，不同的值在数组不同状态中起着举足轻重的作用：

数组未初始化时，sizeCtl被赋值初始容量，以待初始化数组时使用。
数组正在初始化时，sizeCtl=-1，相当于一把锁，控制只有一个线程进去初始化数组操作。
数组初始化完成，sizeCtl被赋值扩容阈值，以待触发扩容机制时判断。
数组扩容时，sizeCtl被赋值一个非常小的负数，控制扩容线程数量的加减以及用来标识数组正在扩容的状态。

/* ---------------- Fields -------------- */

/**

The array of bins. Lazily initialized upon first insertion.
Size is always a power of two. Accessed directly by iterators.
当前数组

transient volatile Node<K,V>[] table;

/**

扩容后的新数组，只有在数组扩容时不为null。
The next table to use; non-null only while resizing.

private transient volatile Node<K,V>[] nextTable;

/**

Base counter value, used mainly when there is no contention,
but also as a fallback during table initialization
races. Updated via CAS.
数组元素基础计数

private transient volatile long baseCount;

/**

Table initialization and resizing control. When negative, the
table is being initialized or resized: -1 for initialization,
else -(1 + the number of active resizing threads). Otherwise,
when table is null, holds the initial table size to use upon
creation, or 0 for default. After initialization, holds the
next element count value upon which to resize the table.
sizeCtl很重要，不同的值在数组不同状态中起着举足轻重的作用。

private transient volatile int sizeCtl;

/**

transferIndex记录了扩容的进度。
The next table index (plus one) to split while resizing.

private transient volatile int transferIndex;

/**

简易自旋锁，用于控制多线程统计数组元素的
Spinlock (locked via CAS) used when resizing and/or creating CounterCells.

private transient volatile int cellsBusy;

/**

Table of counter cells. When non-null, size is a power of 2.
当cas修改baseCount失败后的线程会去修改对应counterCells数组中一个计数格子。
所以想获取数组内元素的总个数就是baseCount+counterCells数组内所有计数格记录值之和。

private transient volatile CounterCell[] counterCells;

三、构造器优化

java8中的构造器比java7简单很多，不需要初始化各种数据，也没有初始化数组，只是设置了一个初始容量，但是对如何设置一个合理的初始容量做了优化。

java7对传入的initialCapacity除以segment数组的长度，然后简单找到一个大于等于且离平均值最近的2的整数次的数作为内部HashEntry数组的初始容量。而java8认为传入的initialCapacity是使用者预估后面想要添加的元素个数（可能是短期会添加这么多元素），如果预估元素个数已经大于等于或者接近扩容阈值，这样就很容易触发扩容机制。所以java8对初始容量根据扩容阈值做了优化。

1、ConcurrentHashMap(int initialCapacity, float loadFactor, int concurrencyLevel)

先看这个从外部可以传入loadFactor和concurrencyLevel的构造器，这个构造器应该是为了兼容旧版本，因为java8已经没有了显式设置扩容因子的定义，扩容因子固定是3/4，也没有了concurrencyLevel并发级别的概念。而这里传入的loadFactor只在初始化时计算初始容量时有用，不会修改后期的扩容因子（3/4）。

initialCapacity认为是使用者后面短期内想要添加的元素个数，该如何找到一个合适的初始容量避免不必要的扩容呢？

假设计算的初始化容量为size，那扩容阈值就是size*loadFactor，只要扩容阈值大于预估容量initialCapacity就不会触发扩容，有如下不等式关系：

size * loadFactor > initialCapacity，转换一下就是size > initialCapacity / loadFactor。

假设不等式左边只比右边大1，那么只要右边加1就可以使得左右两边相等，即：size = (initialCapacity / loadFactor) +1。这样得到size就是一个比较合理的初始容量，但是为了size是一个大于等于且离size最近的2的整数次方的数，还需要经过tableSizeFor的处理。

public ConcurrentHashMap(int initialCapacity,

float loadFactor, int concurrencyLevel) {

if (!(loadFactor > 0.0f) || initialCapacity < 0 || concurrencyLevel <= 0)

throw new IllegalArgumentException();

// concurrencyLevel的用处不大，为了兼容java7版本

if (initialCapacity < concurrencyLevel) // Use at least as many bins

initialCapacity = concurrencyLevel; // as estimated threads

// initialCapacity和loadFactor都是使用者外部传入，所以可对initialCapacity进行优化

long size = (long)(1.0 + (long)initialCapacity / loadFactor);

// 获取一个大于等于且离size最近的2的整数次方的数

int cap = (size >= (long)MAXIMUM_CAPACITY) ?

MAXIMUM_CAPACITY : tableSizeFor((int)size);

// 此时sizeCtl存的是初始容量

this.sizeCtl = cap;

}

2、ConcurrentHashMap(int initialCapacity)

只传一个参数initialCapacity，这个构造器应该是平时较为常用的，还有一个无参构造器，默认初始容量是16。

优化的细节和上一个构造器差不多，扩容因子是固定的3/4，假设初始容量是size，则一元一次方程：

size = initialCapacity * 4/3 + 1 ，即size =(initialCapacity + initialCapacity * 1/3) +1。

但是代码中为什么没有这么做呢？而是size = (initialCapacity+ initialCapacity*1/2) + 1，这样阈值就是2/3，不是3/4了。

个人猜想：为了追求计算性能，1/3无法使用位运算，1/2可以用位运算>>>1，且1/2比1/3稍微大一些，计算出的size不会与理想值偏差太大而浪费空闲资源。

public ConcurrentHashMap(int initialCapacity) {

if (initialCapacity < 0)

throw new IllegalArgumentException();

int cap = ((initialCapacity >= (MAXIMUM_CAPACITY >>> 1)) ?

MAXIMUM_CAPACITY :

tableSizeFor(initialCapacity + (initialCapacity >>> 1) + 1));

// 1.5倍的初始容量+1，再往上取最接近的2的整数次方

// 初始化时只是设置了初始值，并没有初始化数组，懒加载，put时在初始化数组

this.sizeCtl = cap;

}

3、tableSizeFor

有必要讲一下tableSizeFor，这个函数的作用很简单，就是获取大于等于且离传入值最近的2的整数次的数。其运算过程是使一个数二进制最左边的1右边位全部转化为1，然后+1就可得一个2的整数次方的数。

/**

找到大于等于c的最近2的整数次的数
@param c
@return

private static final int tableSizeFor(int c) {

// 为什么要减1呢?

int n = c - 1;

// 向右移1位，与旧值|，逻辑上可得到2个1

n |= n >>> 1;

// 向右移2位，与旧值|，逻辑上可得到4个1

n |= n >>> 2;

// 向右移4位，与旧值|，逻辑上可得到8个1

n |= n >>> 4;

// 向右移8位，与旧值|，逻辑上可得到16个1

n |= n >>> 8;

// 向右移16位，与旧值|，逻辑上可得到32个1

n |= n >>> 16;

// n+1 得到大于等于c的最近2的整数次的数

return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;

}

计算过程如图：

tableSizeFor

为何传入的c还要减1呢？

假设c=16 二进制：10000，c-1=15，二进制：1111经过一顿右移和旧值的|运算，得到的还是1111，+1还是16。

而c不-1，直接拿10000做运算，得到的是11111，+1是32，这就不太对了，明明传进去的就是一个2的整数次方的数，得到的确实2倍c。所以为了兼容这种情况传进来的c都减1。

四、不可不知的节点定义

在阅读put、get等源码逻辑前，还必须了解以下几种节点的定义：

构成链表的普通节点Node。
构成红黑树的TreeBin+TreeNode。
转发节点ForwardingNode。

1、普通节点Node

和java7中HashEntry定义差不多，是构成链表的基本元素。hash >= 0，后面代码中会根据hash>=0 判断为普通节点，即链表。

static class Node<K,V> implements Map.Entry<K,V> {

final int hash;

final K key;

volatile V val;

volatile Node<K,V> next;

… …

/**

Virtualized support for map.get(); overridden in subclasses.
遍历链表寻找哈希和key都相同的节点

Node<K,V> find(int h, Object k) {

Node<K,V> e = this;

if (k != null) {

do {

K ek;

if (e.hash == h &&

((ek = e.key) == k || (ek != null && k.equals(ek))))

return e;

} while ((e = e.next) != null);

}

return null;

}

2、TreeBin+TreeNode

构成红黑树的节点有两种，TreeBin是根节点，也是一个空节点，不存任何key-value，TreeNode是真正存key-value的节点。

（1）TreeBin 根节点

TreeBin虽然不存任何元素，但是肩负管理红黑树的职责：向红黑树添加、删除节点，查找节点等。如何构成红黑树以及如何维护红黑树的特性，不是本篇的重点，后期会单独拎出来研究。

一个节点新增时首先会以头插法的方式串成一个链表，然后另外再维护一棵红黑树的形态。而依然维护链表的结构主要是为了当红黑树在做平衡算法时，依然可以用遍历链表的方式遍历节点。

TreeBin内部简单维护了一把自旋读写锁，目的是在当新增和删除节点时，需要维护红黑树的结构特性，这个平衡算法的过程需要加锁。而新增节点以头插法的方式串成链表，所以修改不会影响遍历过程且next指针被volatile修饰，修改指针后会立即通知到所有线程获取最新值。

读写锁比较有意思，lockState记录锁的状态，有三种标志位：

WRITER=1，二进制低位第一位用来标识写线程持有锁的状态（不可重入写锁）。
WAITER=2，二进制低位第二位用来标识阻塞状态。
WAITER=4，二进制低位第三位之后都是用来标识读线程持有锁的状态。读读不互斥，lockState+READER代表一个读线程获取锁，lockState-READER代表一个读线程释放锁。读锁释放时如果有线程正在等待阻塞（写线程），则唤醒。

还有一个点需要强调，TreeBin作为一棵红黑树的根节点也就是头节点，同是数组中占位的节点，其hash值为TREEBIN=-2，后面代码会根据hash< 0 && f instanceof TreeBin 判断是红黑树。

static final class TreeBin<K,V> extends Node<K,V> {

// 红黑树根节点

TreeNode<K,V> root;

// 红黑树按链表遍历的第一个节点

volatile TreeNode<K,V> first;

// 阻塞等待的线程

volatile Thread waiter;

// 锁的状态

volatile int lockState;

// values for lockState

// 二进制低位第一位用来标识写线程持有锁的状态（不可重入锁）

static final int WRITER = 1; // set while holding write lock

// 二进制低位第二位用来标识阻塞状态

static final int WAITER = 2; // set when waiting for write lock

// 二进制低位第三位之后都是用来标识读线程持有锁的状态

static final int READER = 4; // increment value for setting read lock

/**

Creates bin with initial set of nodes headed by b.
hash=TREEBIN < 0 && f instanceof TreeBin 可判断是红黑树

TreeBin(TreeNode<K,V> b) {

super(TREEBIN, null, null, null);

this.first = b;

… …

}

/**

Acquires write lock for tree restructuring.

private final void lockRoot() {

if (!U.compareAndSwapInt(this, LOCKSTATE, 0, WRITER))

// 获取写锁失败，则竞争加锁，可能会阻塞

contendedLock(); // offload to separate method

}

/**

Releases write lock for tree restructuring.

private final void unlockRoot() {

lockState = 0;

}

/**

Possibly blocks awaiting root lock.

private final void contendedLock() {

boolean waiting = false;

for (int s;😉 {

// ~WAITER = - (WAITER + 1) 11111111111111111111111111111101

if (((s = lockState) & ~WAITER) == 0) {

// 没有线程还有锁，lockState=0 or 2，则获取写锁

if (U.compareAndSwapInt(this, LOCKSTATE, s, WRITER)) {

if (waiting)

waiter = null;

return;

}

// != 0, s有可能=1 or 4，8,12… 即有线程持有写锁or读锁，则当前线程需要阻塞

else if ((s & WAITER) == 0) {

if (U.compareAndSwapInt(this, LOCKSTATE, s, s | WAITER)) {

waiting = true;

waiter = Thread.currentThread();

}

else if (waiting)

LockSupport.park(this);

}

/**

Returns matching node or null if none. Tries to search
using tree comparisons from root, but continues linear
search when lock not available.

final Node<K,V> find(int h, Object k) {

if (k != null) {

for (Node<K,V> e = first; e != null; ) {

int s; K ek;

// 二进制的低位1位是标识写锁，2位标识阻塞

if (((s = lockState) & (WAITER|WRITER)) != 0) {

// 可能有线程持有写锁or阻塞，说明正在做平衡算法，不能使用红黑树来遍历节点

// 但是可以像普通链表一样遍历节点

if (e.hash == h &&

((ek = e.key) == k || (ek != null && k.equals(ek))))

return e;

e = e.next;

}

// == 0 说明没有线程持有写锁和阻塞，则可获取读锁

// 读线程间是不互斥的，所以读线程累加READER

else if (U.compareAndSwapInt(this, LOCKSTATE, s,

s + READER)) {

TreeNode<K,V> r, p;

try {

// 遍历红黑树

p = ((r = root) == null ? null :

r.findTreeNode(h, k, null));

} finally {

Thread w;

// 释放读锁，-READER，释放锁的同时，若有线程在阻塞则唤醒他（一般就是写线程在等待）

// 这里会有不必要的唤醒，因为若不是最后一个读线程释放锁唤醒阻塞的写线程的话，

// 此时还有读线程持有锁，则写线程继续阻塞。

if (U.getAndAddInt(this, LOCKSTATE, -READER) ==

(READER|WAITER) && (w = waiter) != null)

LockSupport.unpark(w);

}

return p;

}

return null;

}

最后

关于面试刷题也是有方法可言的，建议最好是按照专题来进行，然后由基础到高级，由浅入深来，效果会更好。当然，这些内容我也全部整理在一份pdf文档内，分成了以下几大专题：

Java基础部分

算法与编程

数据库部分

流行的框架与新技术（Spring+SpringCloud+SpringCloudAlibaba）

这份面试文档当然不止这些内容，实际上像JVM、设计模式、ZK、MQ、数据结构等其他部分的面试内容均有涉及，因为文章篇幅，就不全部在这里阐述了。

作为一名程序员，阶段性的学习是必不可少的，而且需要保持一定的持续性，这次在这个阶段内，我对一些重点的知识点进行了系统的复习，一方面巩固了自己的基础，另一方面也提升了自己的知识广度和深度。

de(h, k, null));

} finally {

Thread w;

// 释放读锁，-READER，释放锁的同时，若有线程在阻塞则唤醒他（一般就是写线程在等待）

// 这里会有不必要的唤醒，因为若不是最后一个读线程释放锁唤醒阻塞的写线程的话，

// 此时还有读线程持有锁，则写线程继续阻塞。

if (U.getAndAddInt(this, LOCKSTATE, -READER) ==

(READER|WAITER) && (w = waiter) != null)

LockSupport.unpark(w);

}

return p;

}

return null;

}

最后

Java基础部分

[外链图片转存中…(img-PgIuMFLr-1714282882470)]

算法与编程

[外链图片转存中…(img-jD4sdNkA-1714282882471)]

数据库部分

[外链图片转存中…(img-cw8ogDhT-1714282882471)]

流行的框架与新技术（Spring+SpringCloud+SpringCloudAlibaba）

[外链图片转存中…(img-GNpA6pre-1714282882471)]

这份面试文档当然不止这些内容，实际上像JVM、设计模式、ZK、MQ、数据结构等其他部分的面试内容均有涉及，因为文章篇幅，就不全部在这里阐述了。

本文已被CODING开源项目：【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

2401_84023920

关注

29
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
ConcurrentHashMap源码深度解析（一）（java8）—

关于面试刷题也是有方法可言的，建议最好是按照专题来进行，然后由基础到高级，由浅入深来，效果会更好。Java基础部分算法与编程数据库部分流行的框架与新技术（Spring+SpringCloud+SpringCloudAlibaba）这份面试文档当然不止这些内容，实际上像JVM、设计模式、ZK、MQ、数据结构等其他部分的面试内容均有涉及，因为文章篇幅，就不全部在这里阐述了。
复制链接

扫一扫