ConcurrentHashMap简介
ConcurrentHashMap直接使用 Node 数组来保存数据,并且采用 Node 数组元素作为锁来实现每一行数据进行加锁来进一步减少并发冲突的概率数,据结构采用了数组+单向链表+红黑树的结构,为什么要引入红黑树呢?在正常情况下,key hash 之后如果能够很均匀的分散在数组中,那么数组中的每个队列的长度主要为 0 或者 1,但是实际情况下,还是会存在一些队列长度过长的情况。如果采用单向列表方式,那么查询某个节点的时间复杂度就变为 O(n); 因此对于队列长度超过 8 的列表,JDK1.8 采用了红黑树的结构,那么查询的时间复杂度就会降低到O(logN),可以提升查找的性能。
ConcurrentHashMap源码分析
V put(K key, V value)方法
public V put(K key, V value) {
return putVal(key, value, false);
}
final V putVal(K key, V value, boolean onlyIfAbsent) {
if (key == null || value == null) throw new NullPointerException();
// 得到一个hash值
int hash = spread(key.hashCode());
// 记录链表的长度
int binCount = 0;
for (Node<K,V>[] tab = table;;) {
Node<K,V> f; int n, i, fh;
if (tab == null || (n = tab.length) == 0)
// 如果数组为空,则初始化数组
tab = initTable();
// i是数组下标,tabAt()表示通过偏移量直接在内存中拿到tab数组中i下标的值
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
// 通过 cas 将新的值封装成 node 插入;如果 cas 失败,说明存在竞争,则进入下一次循环
if (casTabAt(tab, i, null,
new Node<K,V>(hash, key, value, null)))
break; // no lock when adding to empty bin
}
// 如果对应的节点存在,判断这个节点的 hash 是不是等于 MOVED(-1),说明当前节点是ForwardingNode 节点,
// 意味着有其他线程正在进行扩容,那么当前现在直接帮助它进行扩容,因此调用 helpTransfer方法
else if ((fh = f.hash) == MOVED)
// 协助扩容
tab = helpTransfer(tab, f);
// 处理hash冲突
else {//进入到这个分支,说明 f 是当前 nodes 数组对应位置节点的头节点,并且不为空
V oldVal = null;
// 给对应的头结点加锁
synchronized (f) {
if (tabAt(tab, i) == f) {//再次判断对应下标位置是否为 f 节点
// 头结点的 hash 值大于 0,说明是链表
if (fh >= 0) {
// 代表链表的长度
binCount = 1;
for (Node<K,V> e = f;; ++binCount) {//遍历链表
K ek;
// 判断是否是同一个key,如果是则替换value值
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) {
oldVal = e.val;
if (!onlyIfAbsent)//默认情况下,直接覆盖旧的值
e.val = value;
break;
}
// 不是同一个key的情况,一直遍历到链表的最末端,直接把新的值加入到链表的最后面
Node<K,V> pred = e;
if ((e = e.next) == null) {
pred.next = new Node<K,V>(hash, key,
value, null);
break;
}
}
}
//如果当前的 f 节点是一颗红黑树
else if (f instanceof TreeBin) {
Node<K,V> p;
binCount = 2;
//则调用红黑树的插入方法插入新的值
if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
value)) != null) {
oldVal = p.val;//同样,如果值已经存在,则直接替换
if (!onlyIfAbsent)
p.val = value;
}
}
}
}
// 链表长度大于8,则转变成红黑树
if (binCount != 0) {//说明上面在做链表操作
//如果链表长度已经达到临界值 8 就需要把链表转换为树结构
if (binCount >= TREEIFY_THRESHOLD)
// 扩容或者红黑树的 转化操作
treeifyBin(tab, i);
if (oldVal != null)//如果 val 是被替换的,则返回替换之前的值
return oldVal;
break;
}
}
}
// 元素个数的统计和更新
addCount(1L, binCount);
return null;
}
put方法中的第一个阶段:初始化
- Node<K,V>[] initTable();初始化数组(第一个if条件)
if (tab == null || (n = tab.length) == 0)
// 如果数组为空,则初始化数组
tab = initTable();
private final Node<K,V>[] initTable() {
Node<K,V>[] tab; int sc;
while ((tab = table) == null || tab.length == 0) {
// 小于0说明已经有线程在进行初始化
if ((sc = sizeCtl) < 0)
Thread.yield(); // lost initialization race; just spin
// 通过 cas 操作,将 sizeCtl 替换为-1,标识当前线程抢占到了初始化资格
else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
try {
if ((tab = table) == null || tab.length == 0) {
int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
table = tab = nt;
// 计算下次扩容的大小,实际就是当前容量的 0.75倍,这里使用了右移来计算
sc = n - (n >>> 2);
}
} finally {
// 设置sizeCtl 为 sc, 如果默认是 16 的话,那么这个时候sc=16*0.75=12
sizeCtl = sc;
}
break;
}
}
return tab;
}
- 如果数组下标i所对应的数组元素Node为null,则初始化此下标对应的Node(else if put方法中的第二个条件)
// i是数组下标,tabAt()表示通过偏移量直接在内存中拿到tab数组中i下标的值
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
// 通过 cas 将新的值封装成 node 插入;如果 cas 失败,说明存在竞争,则进入下一次循环
if (casTabAt(tab, i, null,
new Node<K,V>(hash, key, value, null)))
break; // no lock when adding to empty bin
}
// i是数组下标,tabAt()表示通过偏移量直接在内存中拿到tab数组中i下标的值
// 该方法获取对象中offset偏移地址对应的对象field的值。实际上这段代码的含义等价于tab[i],
// 但是为什么不直接使用 tab[i]来计算呢?
// getObjectVolatile,一旦看到 volatile 关键字,就表示可见性。因为对 volatile 写操作 happen-before
// 于 volatile 读操作,因此其他线程对 table 的修改均对 get 读取可见;
// 虽然 table 数组本身是增加了 volatile 属性,但是“volatile 的数组只针对数组的引用具有
// volatile 的语义,而不是它的元素”。 所以如果有其他线程对这个数组的元素进行写操作,那
// 么当前线程来读的时候不一定能读到最新的值。
// 出于性能考虑,Doug Lea 直接通过 Unsafe 类来对 table 进行操作。
static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {
return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE);
}
put方法中的第二个阶段:更新ConcurrentHashMap中的元素个数以及引发的扩容
通过addCount来增加ConcurrentHashMap中的元素个数
如何保证 addCount 的数据安全性以及性能?看源码
- void addCount(long x, int check);
// 元素个数的统计和更新
addCount(1L, binCount);
// 元素个数的统计和更新
private final void addCount(long x, int check) {
CounterCell[] as; long b, s;
// 判断 counterCells 是否为空,
// 1.如果为空,就通过 cas 操作尝试修改 baseCount 变量,对这个变量进行原子累加操作
// (做这个操作的意义是:如果在没有竞争的情况下,仍然采用 baseCount 来记录元素个数)
// 2.如果 cas 失败说明存在竞争,这个时候不能再采用 baseCount 来累加,而是通过CounterCell 来记录
if ((as = counterCells) != null ||
// 这个判断条件后进入if语句,说明有线程竞争
!U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
CounterCell a; long v; int m;
// 是否冲突标识,默认为没有冲突
boolean uncontended = true;
// 这里有几个判断:
// 1. 计数表counterCells为空则直接调用 fullAddCount
// 2. 从计数表中随机取出一个数组的位置为空,直接调用 fullAddCount
// 3. 通过 CAS 修改 CounterCell 随机位置的值,如果修改失败说明出现并发情况,调用fullAndCount
// Random 在线程并发的时候会有性能问题以及可能会产生相同的随机数
// ThreadLocalRandom.getProbe 可以解决这个问题,并且性能要比 Random 高
if (as == null || (m = as.length - 1) < 0 ||
(a = as[ThreadLocalRandom.getProbe() & m]) == null ||
!(uncontended =
U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
// 更新元素的个数(包含所有条件更新)
fullAddCount(x, uncontended);
return;
}
if (check <= 1)//链表长度小于等于 1,不需要考虑扩容
return;
s = sumCount();//统计 ConcurrentHashMap 元素个数
}
// 扩容
// 判断是否需要扩容,也就是当更新后的键值对总数>= 阈值 sizeCtl 时,进行rehash,
// 这里面会有两个逻辑:
// 1) 如果当前正在处于扩容阶段,则当前线程会加入并且协助扩容
// 2) 如果当前没有在扩容,则直接触发扩容操作
if (check >= 0) {
Node<K,V>[] tab, nt; int n, sc;
// 符合while循环的条件,进入while循环,代表需要扩容
while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
(n = tab.length) < MAXIMUM_CAPACITY) {
// 生成一个和扩容有关的扩容戳
int rs = resizeStamp(n);
// sc < 0 表示已经有线程正在扩容
if (sc < 0) {
// 这 5 个条件只要有一个条件为 true,说明当前线程不能帮助进行此次的扩容,直接跳出循环
// sc >>> RESIZE_STAMP_SHIFT != rs 表示比较高 RESIZE_STAMP_BITS 位生成戳和 rs 是否相等,相同
// sc = rs +1 表示扩容结束
// sc == rs + MAX_RESIZERS 表示帮助线程线程已经达到最大值了
// (nt = nextTable) == null表示扩容已经结束
// transferIndex <= 0 表示所有的 transfer 任务都被领取完了
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
transferIndex <= 0)
// 表示不需要扩容,直接break
break;
// 当前线程尝试帮助此次扩容,如果成功,则调用 transfer
// +1是记录协助扩容的线程的个数
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
// 协助扩容
transfer(tab, nt);
}
// 如果当前没有在扩容,那么 rs 肯定是一个正数,通过 rs<<RESIZE_STAMP_SHIFT 将 sc 设置为一个负数,
// +2 表示有一个线程在执行扩容
else if (U.compareAndSwapInt(this, SIZECTL, sc,
(rs << RESIZE_STAMP_SHIFT) + 2))
// 扩容,当前线程是第一个扩容的
transfer(tab, null);
// 重新计数,判断是否需要开启下一轮扩容
s = sumCount();
}
}
}
- 关于CounterCells的解释
// 存在竞争时更新的元素个数, 总数值的分值分别存在每个 CounterCell 中
private transient volatile CounterCell[] counterCells;
// CounterCells 解释:
// ConcurrentHashMap 是采用 CounterCell 数组来记录元素个数的,像一般的集合记录集合大小,
// 直接定义一个 size 的成员变量即可,当出现改变的时候只要更新这个变量就行。
// 为什么ConcurrentHashMap 要用这种形式来处理呢?
// 问题还是处在并发上,ConcurrentHashMap 是并发集合,如果用一个成员变量来统计元素个数的话,
// 为了保证并发情况下共享变量的安全性,势必会需要通过加锁或者自旋来实现,
// 如果竞争比较激烈的情况下,size 的设置上会出现比较大的冲突反而影响了性能,
// 所以在ConcurrentHashMap 采用了分片的方法来记录大小
@sun.misc.Contended static final class CounterCell {
// 元素个数
volatile long value;
CounterCell(long x) { value = x; }
}
- void fullAddCount(long x, boolean wasUncontended);
// fullAddCount 主要是用来初始化 CounterCell,来记录元素个数,里面包含扩容,初始化等操作
private final void fullAddCount(long x, boolean wasUncontended) {
// h就是随机数
int h;
// 获取当前线程的 probe 的值,如果值为 0,则初始化当前线程的 probe 的值,probe 就是随机数
if ((h = ThreadLocalRandom.getProbe()) == 0) {
ThreadLocalRandom.localInit(); // force initialization
h = ThreadLocalRandom.getProbe();
wasUncontended = true;// 由于重新生成了 probe,未冲突标志位设置为 true
}
boolean collide = false; // True if last slot nonempty
for (;;) {
CounterCell[] as; CounterCell a; int n; long v;
// 已经初始化完成了的情况
if ((as = counterCells) != null && (n = as.length) > 0) {
// 对应数组下标的元素还没有初始化
if ((a = as[(n - 1) & h]) == null) {
// cellsBusy=0 表示 counterCells 不在初始化或者扩容状态下
if (cellsBusy == 0) { // Try to attach new Cell
CounterCell r = new CounterCell(x); // Optimistic create
// 加锁
if (cellsBusy == 0 &&
//通过 cas 设置 cellsBusy 标识,防止其他线程来对 counterCells 并发处理
U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
boolean created = false;
try { // Recheck under lock
CounterCell[] rs; int m, j;
//将初始化的 r 对象放在对应下标的位置
if ((rs = counterCells) != null &&
(m = rs.length) > 0 &&
rs[j = (m - 1) & h] == null) {
rs[j] = r;
created = true;
}
} finally {//恢复标志位
cellsBusy = 0;
}
if (created)//创建成功,退出循环
break;
continue;//说明指定 cells 下标位置的数据不为空,则进行下一次循环 // Slot is now non-empty
}
}
collide = false;
}
// 说明在 addCount 方法中 cas 失败了,并且获取 probe 的值不为空
else if (!wasUncontended) // CAS already known to fail
// 设置为未冲突标识,进入下一次自旋
wasUncontended = true; // Continue after rehash
// 由于指定下标位置的 cell 值不为空,则直接通过 cas 进行原子累加,如果成功,则直接退出
else if (U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))
break;
// 如果已经有其他线程建立了新的 counterCells 或者 CounterCells 大于 CPU 核心数
// (很巧妙,线程的并发数不会超过 cpu 核心数)
else if (counterCells != as || n >= NCPU)
//设置当前线程的循环失败不进行扩容
collide = false; // At max size or stale
// 恢复 collide 状态,标识下次循环会进行扩容
else if (!collide)
collide = true;
// 来到这说明竞争激烈, CounterCell 数组容量不够,需要扩容,需要先获得锁在扩容
else if (cellsBusy == 0 &&
U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
try {
if (counterCells == as) {// Expand table unless stale
// 扩容一倍 2 变成 4
CounterCell[] rs = new CounterCell[n << 1];
for (int i = 0; i < n; ++i)
rs[i] = as[i];
counterCells = rs;
}
} finally {
cellsBusy = 0;
}
collide = false;
continue; // Retry with expanded table
}
h = ThreadLocalRandom.advanceProbe(h);//更新随机数的值
}
// 初始化 CounterCells 数组
// cellsBusy=0 表示没有在做初始化,通过 cas 更新 cellsbusy 的值标注当前线程正在做初始化操作
else if (cellsBusy == 0 && counterCells == as &&
U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
boolean init = false;
try { // Initialize table
if (counterCells == as) {
CounterCell[] rs = new CounterCell[2];//初始化容量为 2
rs[h & 1] = new CounterCell(x);//将 x 也就是元素的个数放在指定的数组下标位置
counterCells = rs;
init = true;//设置初始化完成标识
}
} finally {
cellsBusy = 0;//恢复标识
}
if (init)
break;
}
// 如果前面都不满足,说明线程都集中在CounterCells[]中,则尝试直接更新baseCount
else if (U.compareAndSwapLong(this, BASECOUNT, v = baseCount, v + x))
break; // Fall back on using base
}
}
- transfer扩容
判断是否需要扩容,也就是当更新后的键值对总数>= 阈值 sizeCtl 时,进行rehash,
这里面会有两个逻辑:
1) 如果当前正在处于扩容阶段,则当前线程会加入并且协助扩容
2) 如果当前没有在扩容,则直接触发扩容操作
// 扩容
// 判断是否需要扩容,也就是当更新后的键值对总数>= 阈值 sizeCtl 时,进行rehash,
// 这里面会有两个逻辑:
// 1) 如果当前正在处于扩容阶段,则当前线程会加入并且协助扩容
// 2) 如果当前没有在扩容,则直接触发扩容操作
if (check >= 0) {
Node<K,V>[] tab, nt; int n, sc;
// 符合while循环的条件,进入while循环,代表需要扩容
while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
(n = tab.length) < MAXIMUM_CAPACITY) {
// 生成一个和扩容有关的扩容戳
int rs = resizeStamp(n);
// sc < 0 表示已经有线程正在扩容
if (sc < 0) {
// 这 5 个条件只要有一个条件为 true,说明当前线程不能帮助进行此次的扩容,直接跳出循环
// sc >>> RESIZE_STAMP_SHIFT != rs 表示比较高 RESIZE_STAMP_BITS 位生成戳和 rs 是否相等,相同
// sc = rs +1 表示扩容结束
// sc == rs + MAX_RESIZERS 表示帮助线程线程已经达到最大值了
// (nt = nextTable) == null表示扩容已经结束
// transferIndex <= 0 表示所有的 transfer 任务都被领取完了
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
transferIndex <= 0)
// 表示不需要扩容,直接break
break;
// 当前线程尝试帮助此次扩容,如果成功,则调用 transfer
// +1是记录协助扩容的线程的个数
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
// 协助扩容
transfer(tab, nt);
}
// 如果当前没有在扩容,那么 rs 肯定是一个正数,通过 rs<<RESIZE_STAMP_SHIFT 将 sc 设置为一个负数,
// +2 表示有一个线程在执行扩容
else if (U.compareAndSwapInt(this, SIZECTL, sc,
(rs << RESIZE_STAMP_SHIFT) + 2))
// 扩容,当前线程是第一个扩容的
transfer(tab, null);
// 重新计数,判断是否需要开启下一轮扩容
s = sumCount();
}
}
}
- int resizeStamp(int n);
// Integer.numberOfLeadingZeros这个方法是返回无符号整数n最高位非0位前面的0的个数
// 比如10的二进制是 0000 0000 0000 0000 0000 0000 0000 1010那么这个方法返回的值就是28
// 根据 resizeStamp 的运算逻辑,我们来推演一下,假如 n=16,那么 resizeStamp(16)=32796
// 转化为二进制是[0000 0000 0000 0000 1000 0000 0001 1100]
// 当第一个线程尝试进行扩容的时候
// 会执行下面这段代码 U.compareAndSwapInt(this, SIZECTL, sc, (rs << RESIZE_STAMP_SHIFT) + 2)
// rs 左移16位,相当于原本的二进制低位变成了高位 1000 0000 0001 1100 0000 0000 0000 0000
// 然后再+2 =1000 0000 0001 1100 0000 0000 0000 0000+10=1000 0000 0001 1100 0000 0000 0000 0010
// 高16位代表扩容的标记、低 16 位代表并行扩容的线程数
// 这样来存储的好处:
// 1. 首先在 CHM 中是支持并发扩容的,也就是说如果当前的数组需要进行扩容操作,
// 可以由多个线程来共同负责
// 2. 可以保证每次扩容都生成唯一的生成戳,每次新的扩容,都有一个不同的 n,这个生成
// 戳就是根据 n 来计算出来的一个数字,n 不同,这个数字也不同
// 第一个线程尝试扩容的时候,为什么是+2?
// 因为 1 表示初始化,2 表示一个线程在执行扩容,而且对 sizeCtl 的操作都是基于位运算的,
// 所以不会关心它本身的数值是多少,只关心它在二进制上的数值,而 sc + 1 会在低 16 位上加 1
static final int resizeStamp(int n) {
return Integer.numberOfLeadingZeros(n) | (1 << (RESIZE_STAMP_BITS - 1));
}
- void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab);
扩容操作的核心在于数据的转移,在单线程环境下数据的转移很简单,无非就是把旧数组中的数据迁移到新的数组。但是这在多线程环境下,在扩容的时候其他线程也可能正在添加元素,这时又触发了扩容怎么办?可能想到的第一个解决方案是加互斥锁,把转移过程锁住,虽然是可行的解决方案,但是会带来较大的性能开销。因为互斥锁会导致所有访问临界区的线程陷入到阻塞状态,持有锁的线程耗时越长,其他竞争线程就会一直被阻塞,导致吞吐量较低。而且还可能导致死锁。而 ConcurrentHashMap 并没有直接加锁,而是采用 CAS 实现无锁的并发同步策略,最精华的部分是它可以利用多线程来进行协同扩容
简单来说,它把 Node 数组当作多个线程之间共享的任务队列,然后通过维护一个指针来划分每个线程锁负责的区间,每个线程通过区间逆向遍历来实现扩容,一个已经迁移完的
bucket会被替换为一个ForwardingNode节点,标记当前bucket已经被其他线程迁移完了。
// 扩容,包括扩容和数据迁移
private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
int n = tab.length, stride;
// 计算一个区间值stride
// 将 (n>>>3 相当于 n/8) 然后除以 CPU 核心数。如果得到的结果小于 16,那么就使用 16
// 这里的目的是让每个 CPU 处理的桶一样多,避免出现转移任务不均匀的现象,如果桶(数组对应的元素及其链表)较少的话,
// 默认一个 CPU(一个线程)处理 16 个桶,也就是长度为 16 的时候,扩容的时候只会有一个线程来扩容
if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
stride = MIN_TRANSFER_STRIDE; // subdivide range
//nextTab 未初始化, nextTab 是用来扩容的 node 数组
if (nextTab == null) {
// initiating
// 扩容
try {
@SuppressWarnings("unchecked")
//新建一个 n<<1 原始 table 大小的 nextTab,也就是 32
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
nextTab = nt;
} catch (Throwable ex) { // try to cope with OOME
sizeCtl = Integer.MAX_VALUE;//扩容失败,sizeCtl 使用 int 的最大值
return;
}
nextTable = nextTab;
transferIndex = n;//更新转移下标,表示转移时的下标
}
int nextn = nextTab.length;
// 创建一个 fwd 节点,表示一个正在被迁移的 Node,并且它的 hash 值为-1(MOVED),
// 也就是前面 putval 方法的时候,会有一个判断 MOVED 的逻辑。它的作用是用来占位,
// 表示原数组中位置 i 处的节点完成迁移以后,就会在 i 位置设置一个 fwd 来告诉其他线程这个位置已经处理过了
ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
// advance:这个变量是用于提示代码是否进行推进处理,也就是当前桶处理完,处理下一个桶的标识
// 首次推进为 true,如果等于 true,说明需要再次推进一个下标(i--),
// 反之,如果是false,那么就不能推进下标,需要将当前的下标处理完毕才能继续推进
boolean advance = true;
// finishing:这个变量用于提示扩容是否结束用的,完成就 return,退出循环
boolean finishing = false; // to ensure sweep before committing nextTab
// 通过 for 自循环处理每个槽位中的链表元素,默认 advace 为真,通过 CAS 设置transferIndex 属性值,
// 并初始化 i 和 bound 值, i 指当前处理的槽位序号, bound 指需要处理的槽位边界,先处理槽位 15 的节点;
for (int i = 0, bound = 0;;) {
// 这个循环使用 CAS 不断尝试为当前线程分配任务
// 直到分配成功或任务队列已经被全部分配完毕
// 如果当前线程已经被分配过 bucket 区域
// 那么会通过--i 指向下一个待处理 bucket 然后退出该循环
Node<K,V> f; int fh;
// 通过while循环分配区间
while (advance) {
int nextIndex, nextBound;
//--i 表示下一个待处理的 bucket,如果它>=bound,表示当前线程已经分配过bucket 区域
if (--i >= bound || finishing)
advance = false;
//表示所有 bucket 已经被分配完毕
else if ((nextIndex = transferIndex) <= 0) {
i = -1;
advance = false;
}
// 通过 cas 来修改 TRANSFERINDEX,为当前线程分配任务,处理的节点区间为(nextBound,nextIndex)->(0,15)
else if (U.compareAndSwapInt
(this, TRANSFERINDEX, nextIndex,
nextBound = (nextIndex > stride ?
nextIndex - stride : 0))) {
bound = nextBound;
i = nextIndex - 1;
advance = false;
}
}
// i<0 说明已经遍历完旧的数组,也就是当前线程已经处理完所有负责的 bucket
if (i < 0 || i >= n || i + n >= nextn) {
int sc;
if (finishing) {//如果完成了扩容
nextTable = null;//删除成员变量
table = nextTab;//更新 table 数组
sizeCtl = (n << 1) - (n >>> 1);//更新阈值(32*0.75=24)
return;
}
// sizeCtl 在迁移前会设置为 (rs << RESIZE_STAMP_SHIFT) + 2
// 然后,每增加一个线程参与迁移就会将 sizeCtl 加 1,
// 这里使用 CAS 操作对 sizeCtl 的低 16 位进行减 1,代表做完了属于自己的任务
if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
// 第一个扩容的线程,执行 transfer 方法之前,会设置 sizeCtl = (resizeStamp(n) << RESIZE_STAMP_SHIFT) + 2)
// 后续帮其扩容的线程,执行 transfer 方法之前,会设置 sizeCtl = sizeCtl+1
// 每一个退出 transfer 的方法的线程,退出之前,会设置 sizeCtl = sizeCtl-1
// 那么最后一个线程退出时必然有:
// sc == (resizeStamp(n) << RESIZE_STAMP_SHIFT) + 2),
// 即 (sc - 2) == resizeStamp(n) << RESIZE_STAMP_SHIFT
// 如果 sc - 2 不等于标识符左移 16 位,说明还有线程在进行扩容
// 如果他们相等了,说明没有线程在帮助他们扩容了。也就是说,扩容结束了。
if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
return;
// 如果相等,扩容结束了,更新 finising 变量
finishing = advance = true;
// 再次循环检查一下整张表
i = n; // recheck before commit
}
}
// 如果位置 i 处是空的,没有任何节点,那么放入刚刚初始化的 ForwardingNode ”空节点“
else if ((f = tabAt(tab, i)) == null)
advance = casTabAt(tab, i, null, fwd);
// 表示该位置已经完成了迁移,也就是如果线程 A 已经处理过这个节点,那么线程 B 处理这个节点时,hash 值一定为 MOVED
else if ((fh = f.hash) == MOVED)
advance = true; // already processed
// 数据迁移
else {
synchronized (f) {//对数组该节点位置加锁,开始处理数组该位置的迁移工作
if (tabAt(tab, i) == f) {
// ln低位链
// hn高位链
Node<K,V> ln, hn;
// 接下来这段代码的作用是把链表拆分成两部分,0 在低位,1 在高位
if (fh >= 0) {
int runBit = fh & n;
Node<K,V> lastRun = f;
// 遍历当前 bucket 的链表,目的是尽量重用 Node 链表尾部的一部分
// 即确定lastRun,lastRun表示高低位不再变换的第一个节点
for (Node<K,V> p = f.next; p != null; p = p.next) {
int b = p.hash & n;
if (b != runBit) {
runBit = b;
lastRun = p;
}
}
// 表示低位
if (runBit == 0) {//如果最后更新的 runBit 是 0,设置低位节点
ln = lastRun;
hn = null;
}
// 表示高位
else {//否则,设置高位节点
hn = lastRun;
ln = null;
}
// 构造高位以及低位的链表
for (Node<K,V> p = f; p != lastRun; p = p.next) {
int ph = p.hash; K pk = p.key; V pv = p.val;
if ((ph & n) == 0)
// 构建低位链
ln = new Node<K,V>(ph, pk, pv, ln);
else
// 构建高位链
hn = new Node<K,V>(ph, pk, pv, hn);
}
// 将低位的链表放在 i 位置也就是不动
setTabAt(nextTab, i, ln);
// 将高位链表放在 i+n 位置
setTabAt(nextTab, i + n, hn);
// 设置标记fwd,表示已经处理过
setTabAt(tab, i, fwd);
advance = true;
}
// 红黑树部分
else if (f instanceof TreeBin) {
TreeBin<K,V> t = (TreeBin<K,V>)f;
TreeNode<K,V> lo = null, loTail = null;
TreeNode<K,V> hi = null, hiTail = null;
int lc = 0, hc = 0;
for (Node<K,V> e = t.first; e != null; e = e.next) {
int h = e.hash;
TreeNode<K,V> p = new TreeNode<K,V>
(h, e.key, e.val, null, null);
if ((h & n) == 0) {
if ((p.prev = loTail) == null)
lo = p;
else
loTail.next = p;
loTail = p;
++lc;
}
else {
if ((p.prev = hiTail) == null)
hi = p;
else
hiTail.next = p;
hiTail = p;
++hc;
}
}
ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
(hc != 0) ? new TreeBin<K,V>(lo) : t;
hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
(lc != 0) ? new TreeBin<K,V>(hi) : t;
setTabAt(nextTab, i, ln);
setTabAt(nextTab, i + n, hn);
setTabAt(tab, i, fwd);
advance = true;
}
}
}
}
}
}
// 这个类是个标识类,用于指向新表用的,其他线程遇到这个类会主动跳过这个类,
// 因为这个类要么就是扩容迁移正在进行,要么就是已经完成扩容迁移,也就是这个类要保证线 程安全,再进行操作
static final class ForwardingNode<K,V> extends Node<K,V> {
final Node<K,V>[] nextTable;
ForwardingNode(Node<K,V>[] tab) {
super(MOVED, null, null, null);
this.nextTable = tab;
}
Node<K,V> find(int h, Object k) {
// loop to avoid arbitrarily deep recursion on forwarding nodes
outer: for (Node<K,V>[] tab = nextTable;;) {
Node<K,V> e; int n;
if (k == null || tab == null || (n = tab.length) == 0 ||
(e = tabAt(tab, (n - 1) & h)) == null)
return null;
for (;;) {
int eh; K ek;
if ((eh = e.hash) == h &&
((ek = e.key) == k || (ek != null && k.equals(ek))))
return e;
if (eh < 0) {
if (e instanceof ForwardingNode) {
tab = ((ForwardingNode<K,V>)e).nextTable;
continue outer;
}
else
return e.find(h, k);
}
if ((e = e.next) == null)
return null;
}
}
}
}
put 方法第三阶段 : 协助扩容。即else if put方法中的第三个条件
// 如果对应的节点存在,判断这个节点的 hash 是不是等于 MOVED(-1),说明当前节点是ForwardingNode 节点,
// 意味着有其他线程正在进行扩容,那么当前现在直接帮助它进行扩容,因此调用 helpTransfer方法
else if ((fh = f.hash) == MOVED)
// 协助扩容
tab = helpTransfer(tab, f);
// 协助扩容
final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
Node<K,V>[] nextTab; int sc;
// 判断此时是否仍然在执行扩容,nextTab=null 的时候说明扩容已经结束了
if (tab != null && (f instanceof ForwardingNode) &&
(nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
int rs = resizeStamp(tab.length);//生成扩容戳
while (nextTab == nextTable && table == tab &&
(sc = sizeCtl) < 0) {//说明扩容还未完成的情况下不断循环来尝试将当前线程加入到扩容操作中
// 下面部分的整个代码表示扩容结束,直接退出循环
// transferIndex <= 0 表示所有的 Node 都已经分配了线程
// sc = rs + MAX_RESIZERS 表示扩容线程数达到最大扩容线程数
// sc >>> RESIZE_STAMP_SHIFT !=rs, 如果在同一轮扩容中,那么 sc 无符号右移比较高位和 rs 的值,那么应该是相等的。如果不相等,说明扩容结束了
// sc == rs+1 表示扩容结束
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || transferIndex <= 0)
break;//跳出循环
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {//在低 16 位上增加扩容线程数
transfer(tab, nextTab);//协助扩容
break;
}
}
return nextTab;
}
return table;//返回新的数组
}
put 方法第四阶段 :解决冲突,即else put方法中的第四个,也是最后一个条件
如果被添加的节点的位置已经存在节点的时候,需要以链表的方式加入到节点中,如果当前节点已经是一颗红黑树,那么就会按照红黑树的规则将当前节点加入到红黑树中
else {//进入到这个分支,说明 f 是当前 nodes 数组对应位置节点的头节点,并且不为空
V oldVal = null;
// 给对应的头结点加锁
synchronized (f) {
if (tabAt(tab, i) == f) {//再次判断对应下标位置是否为 f 节点
// 头结点的 hash 值大于 0,说明是链表
if (fh >= 0) {
// 代表链表的长度
binCount = 1;
for (Node<K,V> e = f;; ++binCount) {//遍历链表
K ek;
// 判断是否是同一个key,如果是则替换value值
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) {
oldVal = e.val;
if (!onlyIfAbsent)//默认情况下,直接覆盖旧的值
e.val = value;
break;
}
// 不是同一个key的情况,一直遍历到链表的最末端,直接把新的值加入到链表的最后面
Node<K,V> pred = e;
if ((e = e.next) == null) {
pred.next = new Node<K,V>(hash, key,
value, null);
break;
}
}
}
//如果当前的 f 节点是一颗红黑树
else if (f instanceof TreeBin) {
Node<K,V> p;
binCount = 2;
//则调用红黑树的插入方法插入新的值
if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
value)) != null) {
oldVal = p.val;//同样,如果值已经存在,则直接替换
if (!onlyIfAbsent)
p.val = value;
}
}
}
}
// 链表长度大于8,则转变成红黑树
if (binCount != 0) {
if (binCount >= TREEIFY_THRESHOLD)
treeifyBin(tab, i);
if (oldVal != null)
return oldVal;
break;
}
}
put 方法第五阶段 :链表转换成红黑树
判断链表的长度是否已经达到临界值 8. 如果达到了临界值,这个时候会根据当前数组的长度来决定是扩容还是将链表转化为红黑树。也就是说如果当前数组的长度小于 64,就会先扩容。否则,会把当前链表转化为红黑树
// 链表长度大于8,则转变成红黑树
if (binCount != 0) {//说明上面在做链表操作
//如果链表长度已经达到临界值 8 就需要把链表转换为树结构
if (binCount >= TREEIFY_THRESHOLD)
// 扩容或者红黑树的 转化操作
treeifyBin(tab, i);
if (oldVal != null)//如果 val 是被替换的,则返回替换之前的值
return oldVal;
break;
}
// 在 putVal 的最后部分,有一个判断,如果链表长度大于 8,那么就会触发扩容或者红黑树的 转化操作
private final void treeifyBin(Node<K,V>[] tab, int index) {
Node<K,V> b; int n, sc;
if (tab != null) {
if ((n = tab.length) < MIN_TREEIFY_CAPACITY)//tab 的长度是不是小于 64, 如果是,则执行扩容
tryPresize(n << 1);
else if ((b = tabAt(tab, index)) != null && b.hash >= 0) {//否则,将当前链表转化为红黑树结构存储
synchronized (b) {// 将链表转换成红黑树
if (tabAt(tab, index) == b) {
TreeNode<K,V> hd = null, tl = null;
for (Node<K,V> e = b; e != null; e = e.next) {
TreeNode<K,V> p =
new TreeNode<K,V>(e.hash, e.key, e.val,
null, null);
if ((p.prev = tl) == null)
hd = p;
else
tl.next = p;
tl = p;
}
setTabAt(tab, index, new TreeBin<K,V>(hd));
}
}
}
}
}
// tryPresize 里面部分代码和 addCount 的部分代码类似
private final void tryPresize(int size) {
// 对 size 进行修复,主要目的是防止传入的值不是一个 2 次幂的整数,然后通过tableSizeFor 来讲入参转化为离该整数最近的 2 次幂
int c = (size >= (MAXIMUM_CAPACITY >>> 1)) ? MAXIMUM_CAPACITY :
tableSizeFor(size + (size >>> 1) + 1);
int sc;
while ((sc = sizeCtl) >= 0) {
Node<K,V>[] tab = table; int n;
//下面这段代码和 initTable 是一样的,如果 table 没有初始化,则开始初始化
if (tab == null || (n = tab.length) == 0) {
n = (sc > c) ? sc : c;
if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
try {
if (table == tab) {
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
table = nt;
sc = n - (n >>> 2);//0.75
}
} finally {
sizeCtl = sc;
}
}
}
else if (c <= sc || n >= MAXIMUM_CAPACITY)
break;
else if (tab == table) {//这段代码和 addCount 后部分代码是一样的,做辅助扩容操作
int rs = resizeStamp(n);
if (sc < 0) {
Node<K,V>[] nt;
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
transferIndex <= 0)
break;
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
transfer(tab, nt);
}
else if (U.compareAndSwapInt(this, SIZECTL, sc,
(rs << RESIZE_STAMP_SHIFT) + 2))
transfer(tab, null);
}
}
}