ConcurrentHashMap分析
1.存储结构
private static final int DEFAULT_CAPACITY = 16;//默认大小
transient volatile Node<K,V>[] table;
private transient volatile Node<K,V>[] nextTable;
默认大小16,采用node数组存储数据,nextTable代表扩容时的新数组,初始置Null,resize中会初始化原大小的两倍数组,resize完后也会重置为空。
private transient volatile int sizeCtl;
重要参数,类似hashMap中的threshold,无论是初始化哈希表,还是扩容 rehash 的过程,都是需要依赖这个关键属性的。该属性有以下几种取值:
- 0:默认值
- -1:初始化中,且只有一个线程,其它线程让出CPU等待
- 大于0:相当于 HashMap 中的 threshold,表示阈值
- 小于-1:代表有多个线程正在进行扩容,
private transient volatile int transferIndex;
该属性为扩容时指向带扩容数组的下标,初始为扩容数组长度
private transient volatile long baseCount;
private transient volatile int cellsBusy;
private transient volatile CounterCell[] counterCells;//分段数组
采用类似LongAdder的分开计数的方式计算size,baseCount代表基础size,当无线程竞争是修改该值,cellsBusy代表并发扩容或者new CounterCell的Case状态锁。
1.1 节点类型
node节点描述:
final int hash;//hash值
final K key;
volatile V val;
volatile Node<K,V> next;//next节点
以下节点均继承该节点实现:
- node:普通节点
- ForwardingNode:临时节点,hash值为-1,在扩进行中才会出现,不存储实际的数据,如果旧数组的一个hash桶中全部的节点都迁移到新数组中,旧数组就在这个hash桶中放置一个ForwardingNode,读操作或者迭代读时碰到ForwardingNode时,将操作转发到扩容后的新的table数组上去执行,写操作碰见它时,则尝试帮助扩容。
- ReservationNode: 保留节点
- TreeBin:代理操作TreeNode的特殊节点,因为红黑树进行写入操作,整个树的结构可能会有很大的变化,这个对读线程有很大的影响,内部维持一个读写锁以及等待队列。
- TreeBin:实际存储树节点。
2.put的方法分析
final V putVal(K key, V value, boolean onlyIfAbsent) {
//注意:value为Null的时候会抛出NPE异常
if (key == null || value == null) throw new NullPointerException();
//计算键所对应的 hash 值
int hash = spread(key.hashCode());
int binCount = 0;
for (Node<K,V>[] tab = table;;) {
Node<K,V> f; int n, i, fh;
if (tab == null || (n = tab.length) == 0)
//初始化table
tab = initTable();
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
//如果当前哈希槽没有节点,那么以CAS无锁式向该位置添加一个节点
if (casTabAt(tab, i, null,
new Node<K,V>(hash, key, value, null)))
break; // no lock when adding to empty bin
}
//哈希槽节点正在扩容,则帮助扩容
else if ((fh = f.hash) == MOVED)
tab = helpTransfer(tab, f);
else {
V oldVal = null;
//锁住链表的头结点
synchronized (f) {
//并发两重判断
if (tabAt(tab, i) == f) {
if (fh >= 0) {
//插入新节点至链表尾部
binCount = 1;//链表长度
for (Node<K,V> e = f;; ++binCount) {
K ek;
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) {
oldVal = e.val;
if (!onlyIfAbsent)
e.val = value;
break;
}
Node<K,V> pred = e;
if ((e = e.next) == null) {
pred.next = new Node<K,V>(hash, key,
value, null);
break;
}
}
}
//红黑树节点 hash=-2 其它则在迁移中
else if (f instanceof TreeBin) {
Node<K,V> p;
binCount = 2;
if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
value)) != null) {
oldVal = p.val;
if (!onlyIfAbsent)
p.val = value;
}
}
}
}
if (binCount != 0) {
//链表长度>=8 转换红黑树
if (binCount >= TREEIFY_THRESHOLD)
treeifyBin(tab, i);
//如果是新插入节点 直接return旧值
if (oldVal != null)
return oldVal;
break;
}
}
}
//插入了新节点才能走到这里,计算map的size,并判断是否需要扩容
addCount(1L, binCount);
return null;
}
新节点总是在尾部添加,添加完后进行扩容判断。
接下来分析下table初始化:
private final Node<K,V>[] initTable() {
Node<K,V>[] tab; int sc;
//循环cas更新sizectl
while ((tab = table) == null || tab.length == 0) {
//sizeCtl<0 正在初始化
if ((sc = sizeCtl) < 0)
//放弃cup,循环等待初始化完成
Thread.yield(); // lost initialization race; just spin
//没有线程初始化 cas把sizectl置为-1,表示初始化中
else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
try {
//并发双重验证table是否已初始化
if ((tab = table) == null || tab.length == 0) {
int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
table = tab = nt;
//sc为threshold,扩容阈值,大小为n*0.75
sc = n - (n >>> 2);
}
} finally {
sizeCtl = sc;
}
break;
}
}
return tab;
}
只允许一个线程对表进行初始化,如果不巧有其他线程进来了,那么会让其他线程交出 CPU 等待下次系统调度。这样,保证了表同时只会被一个线程初始化。
接下俩看下新增节点map.szie如何计算,addCount方法:
private final void addCount(long x, int check) {
CounterCell[] as; long b, s;
//尝试更新baseCount,如果有多线程并发修改,则尝试随机修改分散数组元素
if ((as = counterCells) != null ||
!U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
CounterCell a; long v; int m;
boolean uncontended = true;
//多线程二次判断空
if (as == null || (m = as.length - 1) < 0 ||
//随机获取元素为空或则有线程并发修改(cas失败),则循环cas并发修改(longAdder方式)
(a = as[ThreadLocalRandom.getProbe() & m]) == null ||
!(uncontended =
U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
fullAddCount(x, uncontended);
return;
}
//链表长度<=1 不需要考虑扩容
if (check <= 1)
return;
//统计ConcurrentHashMap元素个数
s = sumCount();
}
if (check >= 0) {
Node<K,V>[] tab, nt; int n, sc;
//当元素个数大于sizeCtl(threshold扩容阈值)小于最大值,进行扩容
while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
(n = tab.length) < MAXIMUM_CAPACITY) {
//返回的是对 n 的一个数据校验标识,占 16 位 高位为1
int rs = resizeStamp(n);
if (sc < 0) {
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
transferIndex <= 0)
break;
//sizeCtl<0 代表扩容线程数
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
transfer(tab, nt);
}
//只有一个线程能修改成功,其他线程while重新循环,sizeCtl是volatile变量,保证可见性
//rs << 16 左移位负数,(rs << RESIZE_STAMP_SHIFT) + 2) 表示一个线程
else if (U.compareAndSwapInt(this, SIZECTL, sc,
(rs << RESIZE_STAMP_SHIFT) + 2))
//扩容
transfer(tab, null);
//重新计算size
s = sumCount();
}
}
}
3.扩容
接下来分析下扩容transfer方法:
private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
int n = tab.length, stride;
//根据CPU数计算每个线程扩容哈希桶 最小为16
if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
stride = MIN_TRANSFER_STRIDE; // subdivide range
//第一个扩容线程 初始化新数组
if (nextTab == null) { // initiating
try {
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
nextTab = nt;
} catch (Throwable ex) { // try to cope with OOME
sizeCtl = Integer.MAX_VALUE;
return;
}
nextTable = nextTab;
//开始扩容 更新扩容数组下标
transferIndex = n;
}
int nextn = nextTab.length;
// 创建一个 fwd 节点,用于占位。当别的线程发现这个槽位中是 fwd 类型的节点,则跳过这个节点
ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
//表示当前扩容段是否扩容完成,true则取向前推进,扩容下一段扩容区间
boolean advance = true;
boolean finishing = false; // to ensure sweep before committing nextTab
//死循环 确保所有桶扩容完成,i 表示数组扩容最大下标,bound 数组扩容最小下标
for (int i = 0, bound = 0;;) {
Node<K,V> f; int fh;
//初始每个线程取需要转移的桶区间
while (advance) {
int nextIndex, nextBound;
//当前区间任务还未做完,取下一个桶 或者整个扩容任务完成 无需取新任务,跳出循环修改sizeCtl等
if (--i >= bound || finishing)
advance = false;
//扩容数组下标<=0 说明已经没有区间需要扩容了
else if ((nextIndex = transferIndex) <= 0) {
//-1 下面会直接进入结束扩容动作
i = -1;
advance = false;
}
//cas修改transferIndex扩容数组下标
else if (U.compareAndSwapInt
(this, TRANSFERINDEX, nextIndex,
nextBound = (nextIndex > stride ?
nextIndex - stride : 0))) {
//倒序转移 表示最小转移下标
bound = nextBound;
//表示最大转移下标
i = nextIndex - 1;
advance = false;
}
}
//i < 0 表示已没有需要转移的桶
if (i < 0 || i >= n || i + n >= nextn) {
int sc;
//已完成转移 更改sizeCtl 新数组长度0.75 这里最终只会有一个线程
if (finishing) {
nextTable = null;
table = nextTab;
sizeCtl = (n << 1) - (n >>> 1);
return;
}
//cas修改sizeCtl,线程数-1
if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
//表示不是最后一个线程 直接返回
if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
return;
//是最后一个线程更改finishing,重新循环执行上面的代码,保证只有一个线程
finishing = advance = true;
i = n; // recheck before commit
}
}
else if ((f = tabAt(tab, i)) == null)
//桶上没有节点,Cas修改原数组该节点为fwd节点
advance = casTabAt(tab, i, null, fwd);
else if ((fh = f.hash) == MOVED)
//已经处理过了,循环判断是否取下个区间还是已完成或者 取下一个桶 --i
advance = true; // already processed
else {
//独占锁 锁住头节点 进一步降低锁的粒度
synchronized (f) {
//双重判断在这期间头节点是否被修改 否则重新循环处理
if (tabAt(tab, i) == f) {
//ln 表示不需要移位的节点 hn表示移动hash位
Node<K,V> ln, hn;
//普通节点
if (fh >= 0) {
//取hash的高位 由于n=2的整数(1000)幂且扩容后的新长度为 n << 1(10000),定位hash桶位置为hash & n-1(111) ,只需要知道hash的高一位是否为1,如果为1,这个该元素在新数组的位置为index+n,hash&n(1000)取高一位
int runBit = fh & n;
//取该链表最后一个与上一个节点hash不同的节点
//减少下面遍历的长度,如果后续节点的hash都一样,只需取该节点移位
Node<K,V> lastRun = f;
//qu
for (Node<K,V> p = f.next; p != null; p = p.next) {
int b = p.hash & n;
if (b != runBit) {
runBit = b;
lastRun = p;
}
}
//高位0 表示不需要移动hash桶
if (runBit == 0) {
ln = lastRun;
hn = null;
}
else {
hn = lastRun;
ln = null;
}
//遍历到最后一个hash变更的节点
for (Node<K,V> p = f; p != lastRun; p = p.next) {
int ph = p.hash; K pk = p.key; V pv = p.val;
if ((ph & n) == 0)
ln = new Node<K,V>(ph, pk, pv, ln);
else
hn = new Node<K,V>(ph, pk, pv, hn);
}
//unsafe设置数组元素
setTabAt(nextTab, i, ln);
//移动到i+n位置
setTabAt(nextTab, i + n, hn);
//设置原数组hash桶位fwd节点
setTabAt(tab, i, fwd);
//继续验证下一个节点
advance = true;
}
//树节点
else if (f instanceof TreeBin) {
TreeBin<K,V> t = (TreeBin<K,V>)f;
TreeNode<K,V> lo = null, loTail = null;
TreeNode<K,V> hi = null, hiTail = null;
int lc = 0, hc = 0;
for (Node<K,V> e = t.first; e != null; e = e.next) {
int h = e.hash;
TreeNode<K,V> p = new TreeNode<K,V>
(h, e.key, e.val, null, null);
// 和链表相同的判断,与运算 == 0 的放在低位
if ((h & n) == 0) {
if ((p.prev = loTail) == null)
lo = p;
else
loTail.next = p;
loTail = p;
++lc;
}
else {
if ((p.prev = hiTail) == null)
hi = p;
else
hiTail.next = p;
hiTail = p;
++hc;
}
}
// 如果树的节点数小于等于 6,那么转成链表,反之,创建一个新的树
ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
(hc != 0) ? new TreeBin<K,V>(lo) : t;
hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
(lc != 0) ? new TreeBin<K,V>(hi) : t;
//和链表一样设置 节点
setTabAt(nextTab, i, ln);
setTabAt(nextTab, i + n, hn);
setTabAt(tab, i, fwd);
advance = true;
}
}
}
}
}
}
// 返回的是对 n 的一个数据校验标识,占 16 位
static final int resizeStamp(int n) {
return Integer.numberOfLeadingZeros(n) | (1 << (RESIZE_STAMP_BITS - 1));
}
从上面的分析可以看出,如果自始至终,只有一个线程,会分批处理hash桶,处理完之后继续处理下一个区间的hash桶,如果是多线程通过cas尝试更改任务区间下标transferIndex值,更新成功则确认认领这一段区间任务,每更新完一个hash桶,则修改老的数组hash桶的头节点位ForwardingNode,多线程处理会根据hash桶的头节点类型ForwardingNode,去帮助扩容。
final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
Node<K,V>[] nextTab; int sc;
//再次验证节点类型并验证新数组是否为空,可能期间已完成扩容nextTab置null
if (tab != null && (f instanceof ForwardingNode) &&
(nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
int rs = resizeStamp(tab.length);
while (nextTab == nextTable && table == tab &&
(sc = sizeCtl) < 0) {
//一些条件判断 大致时sizeCtl被修改了 或扩容完了
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || transferIndex <= 0)
break;
//修改sizeCtl,线程数+1
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {
//扩容
transfer(tab, nextTab);
break;
}
}
return nextTab;
}
return table;
}
多线程扩容,就是多线程去获取自己的那一段任务,然后来完成。
4.size方法分析
1.8后对计算size也做了比较大的改变,采用类似LongAdder的分开存储的方式计算,大大提高了并发的性能。
采用了basecount、counterCells两个元素存储。
计算size的方法:
final long sumCount() {
CounterCell[] as = counterCells; CounterCell a;
long sum = baseCount;
//累加counterCells数组的值
if (as != null) {
for (int i = 0; i < as.length; ++i) {
if ((a = as[i]) != null)
sum += a.value;
}
}
return sum;
}
可以看到并未加锁,每个变量都是volatile修饰保证了可见性。
5.总结
ConcurrentHashMap的多线程扩容,就是分段取任务,如果当前线程发现正在扩容,帮助扩容,充分利用线程。使用Cas+volatile 变量控制一些状态,Synchroized保证实际修改Map的原子性。
JDK1.8对该集合做了大量的改造:
1.降低了锁的粒度
从锁segment到hash头节点,意味着最大并发为table数组的大小。
2.+红黑树的结构
3. 从ReentrantLock换成了Cas+Synchroized
这个优化点个人认为1.6后对Synchroized做了大量的优化,引入了偏向锁、自旋锁,对于锁粒度已经如此细化了,并发争抢可能已经没有那么激烈,同一个线程偏向锁能够加快获取锁的速度,如果有竞争自旋也很快能重新获取锁,避免挂起上下文切换和升级为重量锁,而ReentrantLock只是尝试获取锁,未获取到则新建node在重试一次就被挂起。
4.size的计算方式,新增字段 transient volatile CounterCell[] counterCells
到此ConcurrentHashMap基本分析完成了,再次膜拜Doug Lea大神。
阿里的码出高效:在各种多线程应用场景中,推荐使用此集合进行KV键值对的存储与使用。