ConCurrentHashMap
1.扩容原理
在初始化时如果不传参则为16的默认长度(确保线程安全)
如果传参为24,执行构造方法,长度更替为32
2.sizeCtl的四种情况
sizeCtl ==0 记录初始容量 16
sizeCtl 为正数,记录数组扩容阈值。(数组的初始容量*0.75)
sizeCtl 为负数, 表示正在初始化
sizeCtl 为小于0且不为-1,表示正在扩容,记录正在扩容的线程个数 -(1+n)个线程。
concurrenthashmap不允许有空值空键。但是hashmap可以。
总之在小于0的情况下,必定是初始化
private final Node<K,V>[] initTable() {
Node<K,V>[] tab; int sc;
while ((tab = table) == null || tab.length == 0) {
if ((sc = sizeCtl) < 0)
Thread.yield(); // lost initialization race; just spin
else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
try {
if ((tab = table) == null || tab.length == 0) {
int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
table = tab = nt;
sc = n - (n >>> 2);
}
} finally {
sizeCtl = sc;
}
break;
}
}
return tab;
}
如果sizeCtl小于0,当前线程会释放,如果大于0,则会再次判断一下是否为空或者长度为0,防止二次初始化。
sc = n - (n >>> 2);
这一句算的就是0.75*初始值,实际上就是扩容阈值。
一下为PUT法方
for (Node<K,V>[] tab = table;;) {
Node<K,V> f; int n, i, fh;
if (tab == null || (n = tab.length) == 0)
tab = initTable();
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
if (casTabAt(tab, i, null,
new Node<K,V>(hash, key, value, null)))
break; // no lock when adding to empty bin
}
与原HashMap不同的地方是如果该索引为空的话,则会执行cas操作,即两个线程同时进入该方法,如果线程1成功,则2不成功。
补充:CAS 指令
CAS (Compare And Swap) 指令是一个CPU层级的原子性操作指令。 在 Intel 处理器中, 其汇编指令为 cmpxchg。
该指令概念上存在 3 个参数, 第一个参数【目标地址】, 第二个参数【值1】, 第三个参数【值2】, 指令会比较【目标地址存储的内容】和 【值1】 是否一致, 如果一致, 则将【值 2】 填写到【目标地址】, 其语
义可以用如下的伪代码表示。
多线程协助扩容
synchronized (f) {
if (tabAt(tab, i) == f) {
if (fh >= 0) {
binCount = 1;
for (Node<K,V> e = f;; ++binCount) {
K ek;
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) {
oldVal = e.val;
if (!onlyIfAbsent)
e.val = value;
break;
}
Node<K,V> pred = e;
if ((e = e.next) == null) {
pred.next = new Node<K,V>(hash, key,
value, null);
break;
}
}
}
else if (f instanceof TreeBin) {
Node<K,V> p;
binCount = 2;
if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
value)) != null) {
oldVal = p.val;
if (!onlyIfAbsent)
p.val = value;
}
}
}
}
在这里加锁,加的是某一个slot对象,这个slot桶对象会阻止多线程对同一个slot不停添加单链表元素。这里也是与hashtable有所区别的地方,hashtable是直接把所有的桶都锁起来,只能对单个slot进行单线程操作。
syn下的第一个if判断是判断该结点是否变成了RB树,如果变成了RB树,则树的根节点可能会和该锁的锁对象f结点不同,所以要判断。
之后会判断Hash值是否大于0,如果大于0为普通的链表结构。
CounterCell[] as; long b, s;
if ((as = counterCells) != null ||
!U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
CounterCell a; long v; int m;
boolean uncontended = true;
if (as == null || (m = as.length - 1) < 0 ||
(a = as[ThreadLocalRandom.getProbe() & m]) == null ||
!(uncontended =
U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
fullAddCount(x, uncontended);
return;
}
维护集合长度(cas+自旋)
final long sumCount() {
CounterCell[] as = counterCells; CounterCell a;
long sum = baseCount;
if (as != null) {
for (int i = 0; i < as.length; ++i) {
if ((a = as[i]) != null)
sum += a.value;
}
}
return sum;
}
返回数组长度
private final void addCount(long x, int check) {
CounterCell[] as; long b, s;
if ((as = counterCells) != null ||
!U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
CounterCell a; long v; int m;
boolean uncontended = true;
if (as == null || (m = as.length - 1) < 0 ||
(a = as[ThreadLocalRandom.getProbe() & m]) == null ||
!(uncontended =
U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
fullAddCount(x, uncontended);
return;
}
if (check <= 1)
return;
s = sumCount();
}
if (check >= 0) {
Node<K,V>[] tab, nt; int n, sc;
while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
(n = tab.length) < MAXIMUM_CAPACITY) {
int rs = resizeStamp(n);
if (sc < 0) {
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
transferIndex <= 0)
break;
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
transfer(tab, nt);
}
else if (U.compareAndSwapInt(this, SIZECTL, sc,
(rs << RESIZE_STAMP_SHIFT) + 2))
transfer(tab, null);
s = sumCount();
}
}
数组默认长度counterCells=0;
如果在baseCount里面加入不成功,就会进入fullAddCount方法。
U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
try {
if (counterCells == as) {// Expand table unless stale
CounterCell[] rs = new CounterCell[n << 1];
for (int i = 0; i < n; ++i)
rs[i] = as[i];
counterCells = rs;
}
在此设置数组初始化,如在此多次加入还是不成功,就会扩容(前提是数组为不为空),如果数组为空,就会一直加做cas操作,
if (sc < 0) {
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
transferIndex <= 0)
break;
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
transfer(tab, nt);
}
else if (U.compareAndSwapInt(this, SIZECTL, sc,
(rs << RESIZE_STAMP_SHIFT) + 2))
transfer(tab, null);
s = sumCount();
}
如果有线程走到这里,会直接把[rs << RESIZE_STAMP_SHIFT) + 2)]这一块的rs标记改为一个负数,上述的负数说了,不是初始化就是扩容,在此是扩容,transfer(tab, null);如果有另一个线程进入到这里,就会协助扩容。
int n = tab.length, stride;
if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
stride = MIN_TRANSFER_STRIDE; // subdivide range
if (nextTab == null) { // initiating
try {
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
nextTab = nt;
} catch (Throwable ex) { // try to cope with OOME
sizeCtl = Integer.MAX_VALUE;
return;
}
nextTable = nextTab;
transferIndex = n;
}
上述代码为多线程扩容,如果你的分出来的数组单元小于16,则最小协助扩容数组单位就为16,即一个线程至少要管理16个数组单元
如果你分出来的数组单元大于16,则就用你的给出的数组单元。
if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
while (advance) {
int nextIndex, nextBound;
if (--i >= bound || finishing)
advance = false;
else if ((nextIndex = transferIndex) <= 0) {
i = -1;
advance = false;
}
else if (U.compareAndSwapInt
(this, TRANSFERINDEX, nextIndex,
nextBound = (nextIndex > stride ?
nextIndex - stride : 0))) {
bound = nextBound;
i = nextIndex - 1;
advance = false;
}
}
上诉代码在计算确切每个线程负责多少个数组单元。
每次取对应数量的任务进行数据迁移,迁移任务从元素数组的末尾依稀向前迁移,并且会在已经迁移完成的结点位置设置一个fwd结点。
上图中线程1和线程2格子负责自己的迁移任务,
当线程1完成了自己的任务以后,会再去下一个任务范围的slot位置进行迁移操作,并且每个线程会将已经迁移的slot设为fwd结点。