目录
扩容的条件
while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
(n = tab.length) < MAXIMUM_CAPACITY) {//1
int rs = resizeStamp(n);//2
if (sc < 0) {//3
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
transferIndex <= 0)
break;
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))//4
transfer(tab, nt);
}
else if (U.compareAndSwapInt(this, SIZECTL, sc,
(rs << RESIZE_STAMP_SHIFT) + 2))//5
transfer(tab, null);
s = sumCount();
}
- 当s(当前集合大小)大于等于sizeCtl(扩容阈值,上一篇提到过,如果是长度16的数组,阈值为12)时并且node数组长度小于最大值时触发扩容。sizeCtl在-1时代表正在初始化node数组,初始化完成后会记录下一次触发扩容的极限值,第一条开始扩容是会赋值为一个唯一的扩容戳(基于当前node数组的长度),后续每有一个线程加入扩容时都会加一,退出扩容时都会减一,也就是说当正在扩容时,sizeCtl 的值为:((rs << RESIZE_STAMP_SHIFT) + 2) + (正在扩容的线程数-1) ,并且该状态下 sizeCtl < 0 。
- 生成此次扩容的唯一扩容戳,基于当前node数组生成。
- sc<0代表有线程正在扩容。
- 有线程正在扩容的情况下加入到扩容大军中,将SIZECTL加一
- 如果 没有线程正在扩容,则将SIZECTL设置为一个负数(rs << RESIZE_STAMP_SHIFT) + 2
transfer扩容
private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
int n = tab.length, stride;
if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
stride = MIN_TRANSFER_STRIDE; // subdivide range
if (nextTab == null) { // initiating 1
try {
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
nextTab = nt;
} catch (Throwable ex) { // try to cope with OOME
sizeCtl = Integer.MAX_VALUE;
return;
}
nextTable = nextTab;
transferIndex = n;
}
int nextn = nextTab.length;
ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);//2
boolean advance = true;
boolean finishing = false; // to ensure sweep before committing nextTab
for (int i = 0, bound = 0;;) {
Node<K,V> f; int fh;
while (advance) {
int nextIndex, nextBound;
if (--i >= bound || finishing)
advance = false;
else if ((nextIndex = transferIndex) <= 0) {
i = -1;
advance = false;
}
else if (U.compareAndSwapInt
(this, TRANSFERINDEX, nextIndex,
nextBound = (nextIndex > stride ?
nextIndex - stride : 0))) {//3
bound = nextBound;
i = nextIndex - 1;
advance = false;
}
}
if (i < 0 || i >= n || i + n >= nextn) {//4
int sc;
if (finishing) {
nextTable = null;
table = nextTab;
sizeCtl = (n << 1) - (n >>> 1);
return;
}
if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
return;
finishing = advance = true;
i = n; // recheck before commit
}
}
else if ((f = tabAt(tab, i)) == null)
advance = casTabAt(tab, i, null, fwd);
else if ((fh = f.hash) == MOVED)
advance = true; // already processed
else {
- nextTab是扩容时将数据从旧的node数组迁移到新的node数组,如果 nextTab未初始化,则进行初始化。n<<1表示原node数组16左移1位得到32,说明新的node数组长度是32。
- fwd代表一个标识,当一个线程将一个node迁移完成之后,将其进行标记,其他线程再对这个node进行hash时为MOVED就直接跳过。
- 设置扩容边界和下标,bound=0,i=15。线程会从下标15处向前处理每一个node的数据迁移。
- 遍历完成后,如果完成了扩容,则更新node数组和sizeCtl下次扩容的阈值;如果没有完成扩容,则将sizeCtl减一,表示当前线程退出了扩容。
数据迁移
else {
synchronized (f) {
if (tabAt(tab, i) == f) {
Node<K,V> ln, hn;
if (fh >= 0) {// 1
int runBit = fh & n;
Node<K,V> lastRun = f;
for (Node<K,V> p = f.next; p != null; p = p.next) {
int b = p.hash & n;
if (b != runBit) {
runBit = b;
lastRun = p;
}
}
if (runBit == 0) {
ln = lastRun;
hn = null;
}
else {
hn = lastRun;
ln = null;
}
for (Node<K,V> p = f; p != lastRun; p = p.next) { // 2
int ph = p.hash; K pk = p.key; V pv = p.val;
if ((ph & n) == 0)
ln = new Node<K,V>(ph, pk, pv, ln);
else
hn = new Node<K,V>(ph, pk, pv, hn);
}
setTabAt(nextTab, i, ln);
setTabAt(nextTab, i + n, hn);
setTabAt(tab, i, fwd);
advance = true;
}
else if (f instanceof TreeBin) {
TreeBin<K,V> t = (TreeBin<K,V>)f;
TreeNode<K,V> lo = null, loTail = null;
TreeNode<K,V> hi = null, hiTail = null;
int lc = 0, hc = 0;
for (Node<K,V> e = t.first; e != null; e = e.next) {
int h = e.hash;
TreeNode<K,V> p = new TreeNode<K,V>
(h, e.key, e.val, null, null);
if ((h & n) == 0) {
if ((p.prev = loTail) == null)
lo = p;
else
loTail.next = p;
loTail = p;
++lc;
}
else {
if ((p.prev = hiTail) == null)
hi = p;
else
hiTail.next = p;
hiTail = p;
++hc;
}
}
ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
(hc != 0) ? new TreeBin<K,V>(lo) : t;
hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
(lc != 0) ? new TreeBin<K,V>(hi) : t;
setTabAt(nextTab, i, ln);
setTabAt(nextTab, i + n, hn);
setTabAt(tab, i, fwd);
advance = true;
}
}
}
}
- fh是当前node的hash值,如果>0则表示这个节点还没有被其他线程处理过。通过fh&n(与运算,n是旧node数组的长度)得到runBit。遍历链表对runBit进行修改,最后runBit为0则将其设置为低位节点,否则设置为高位节点。
2.构造高位以及低位的链表,即将链表分为高位和地位两个链表,将低位链表的位置保持不动(即旧的node数组中是什么下标,那么在新的node数组中就是什么下标),将高位链表的位置由原先的下标n放到新node数组的n+16(扩容增加的长度)。
高低位的作用
首先在putVal()方法中有这样一句代码tabAt(tab, i = (n - 1) & hash)来获取node数组某一下标的节点,所以很明显 (n - 1) & hash就是用来获取下标的,这个代表当前node数组的最大下标数和key的hash值的与运算。
设某个hash值为20,二进制0001 0100
当长度为16时,15&20=0000 1111 & 0001 0100=0000 0100=4
当长度为32时(扩容后),31&20=0001 1111 & 0001 0100 =0001 0100=20
可以看到,相同hash在不同的node数组长度的情况下得到的下标是不一样的。
再来看,当hash值为60时
60 & 15=0011 1100&0000 1111=0000 1100=12
60 & 31=0011 1100&0001 1111=0001 1100=28
可以看到两种hash在不同的node数组长度下,当计算下标不同时,相差都是16,也就是扩容的长度。
说白了,就是在迁移某个下标的链表时,当发现链表节点的hash和旧数组长度进行与运算fh & n的第X位为1时(为1时是高位,为0时是低位),说明这个节点的hash在扩容后和(新数组长度-1)的与运算得到的下标与原下标不同,而这个差值刚好是扩容长度16(32-16)。所以将高位直接迁移到原数组下标+扩容长度(16)的位置。