我们都知道ConcurrentHashMap是线程安全的HashMap,我们学习之前得搞清楚这样几个问题。
1.为什么HashMap是线程不安全的,在高并发的情况下,会引发什么样的问题。ConcurrentHashMap又是怎么样去解决问题的。
2.ConcurrentHashMap 与HashTable、HashMap之间的区别:同样是线程安全,为什么要选择ConcurrentHashMap而不是HashTable。
首先我们来看第一个问题:
HashMap在1.7的时候线程不安全是指,当并发执行扩容操作时会造成环形链和数据丢失的情况。(1.7的代码不在具体分析:有兴趣的同学可以自行了解。重点看1.8)
JDK1.8中HashMap线程不安全指的是在put的时候,容易出现值覆盖的问题、
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
}
我们截取HashMap put的部分代码分析。当通过Hash值计算到数组下标的时候,取出对应小标的值,如果为空那么就直接插入。但是当此时有两个线程A,B同时执行到上述代码块。
A执行的时候,检查对应的数组桶的位置,数据为空。去put值进去,然后A的CPU执行时间到了,B执行的时候,数组的桶位置也为空,所以B将值更新进去了,那么A在去put的时候,不在检测是否有值,直接覆盖了B线程的值。这就是1.8中线程不安全的点、
另外,相对于1.8发生线程线程安全的问题带来的影响相对较小。
ConcurrentHashMap与HashTable的比较。HashTable是很早之前为了HashMap在高并发场景下使用而设计的类。直接使用synchronized 将这个容器锁住,多线程的场景下。只能等到上一个线程put值成功,释放锁了以后,才会轮到下一个线程。会有一定的阻塞,造成CPU的浪费。
public synchronized V put(K key, V value) {
// Make sure the value is not null
if (value == null) {
throw new NullPointerException();
}
}
ConcurrentHashMap不同的是:同时是需要通过锁来保证线程安全,但是ConcurrentHashMap使用的锁的力度更小。性能更优。所以我们在日常开放过程,单线程的容器就使用HashMap,多线程的场景下就使用ConcurrentHashMap来保证线程安全。
在1.8之前。ConcurrentHashMap使用的分段锁的手段来实现。数据结构为hashmap(数组加链表)的基础上再套一层segment数组,锁加在segment元素上。1.8中实现了粒度更细的加锁,去掉了segment数组,直接使用synchronized锁住hash后得到的数组下标位置中的第一个元素 ,如下图,这样加锁比segment加锁能支持更高的并发量。
ConcurrentHashMap的get方法的很高效的、读操作是不需要加锁的,及时的高并发的场景下。多个线程也可以同时读同一个key值得value值。接下来我们重点看下。ConcurrentHashMap1.8中的put方法时如果保证线程安全的。
public V put(K key, V value) {
return putVal(key, value, false);
}
/** Implementation for put and putIfAbsent */
final V putVal(K key, V value, boolean onlyIfAbsent) {
if (key == null || value == null) throw new NullPointerException();
int hash = spread(key.hashCode()); // 获取key的hash值
int binCount = 0;
for (Node<K,V>[] tab = table;;) {
Node<K,V> f; int n, i, fh;
// 如果table为空 初始化table
if (tab == null || (n = tab.length) == 0)
tab = initTable();
//如果通过Hash值获取到桶的位置的数据为空。那么插入数据
// Tabat方法通过Volatile保证读取数据的原子性。
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
//通过CAS判断tab桶位置的数据 预期是否为null,如果是,插入一个新的节点、
if (casTabAt(tab, i, null,
new Node<K,V>(hash, key, value, null)))
break; // no lock when adding to empty bin
}
// 判断是否在插入的过程中,table正在扩容
else if ((fh = f.hash) == MOVED)
tab = helpTransfer(tab, f);
else {
V oldVal = null;
//锁住桶位置上第一个节点。
synchronized (f) {
if (tabAt(tab, i) == f) {
if (fh >= 0) {
binCount = 1;
for (Node<K,V> e = f;; ++binCount) {
K ek;
//判断是否为相同的key值,是的话,就覆盖原值、
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) {
oldVal = e.val;
if (!onlyIfAbsent)
e.val = value;
break;
}
// 如果不是那么就找到链表的尾部位置插入新的节点、
Node<K,V> pred = e;
if ((e = e.next) == null) {
pred.next = new Node<K,V>(hash, key,
value, null);
break;
}
}
}
// 如果是红黑树结构的话
else if (f instanceof TreeBin) {
Node<K,V> p;
binCount = 2;
//在数中插入对应的节点、
if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
value)) != null) {
oldVal = p.val;
if (!onlyIfAbsent)
p.val = value;
}
}
}
}
if (binCount != 0) {
// 如果node数量大于8那么就升级为红黑树。
if (binCount >= TREEIFY_THRESHOLD)
treeifyBin(tab, i);
if (oldVal != null)
return oldVal;
break;
}
}
}
addCount(1L, binCount);
return null;
}
首先我们看到hash算法就不太一样,我们之前了解到HashMap的Hash算法是对key进行hash。然后用hash值与高16位进行异或,得到真正的hash值。具体的了解可以看我之前的博文:
https://blog.csdn.net/weixin_44399827/article/details/118499097
concurrentHashMap 更复杂,使得key值得hash值更加散列
static final int spread(int h) {
return (h ^ (h >>> 16)) & HASH_BITS;
}
static final int HASH_BITS = 0x7fffffff; // usable bits of normal node hash
接下来我们来看下helpTransfer方法:
final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
Node<K,V>[] nextTab; int sc;
//如果table不为空并且该下标的第一个node为ForwardingNode(ForwardingNode是一个代表扩容完毕的特殊node)
// 并且存储扩容后数据的nextTable不为空
if (tab != null && (f instanceof ForwardingNode) &&
(nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
int rs = resizeStamp(tab.length);
while (nextTab == nextTable && table == tab &&
(sc = sizeCtl) < 0) {
//扩容结束,跳出循环不参与扩容
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || transferIndex <= 0)
break;
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {
//扩容
transfer(tab, nextTab);
break;
}
}
//返回扩容后的table,供上层方法使用
return nextTab;
}
return table;
}
最重要的扩容方法transfer:
private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
int n = tab.length, stride;
//根据cpu核数计算出步长,用于分割扩容任务,方便其余线程帮助扩容,最小为16
if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
stride = MIN_TRANSFER_STRIDE;
//判断nextTab是否为空,nextTab是暂时存储扩容后的node的数组,第一次进入这个方法的线程才会发现nextTab为空
//前文提到的helpTransfer也会调用该方法,当helpTransfer调用该方法时nextTab不为空
if (nextTab == null) {
try {
@SuppressWarnings("unchecked")
//初始化nextTab为table长度的2倍
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
nextTab = nt;
} catch (Throwable ex) {
//如果发生了异常,则将sizeCtl设为integer的最大值,因为前文提过数组长度大于1<<30时就不能再扩容了
sizeCtl = Integer.MAX_VALUE;
return;
}
nextTable = nextTab;
//将transferIndex赋值为原数组table的长度
transferIndex = n;
}
int nextn = nextTab.length;
ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
boolean advance = true;
boolean finishing = false;
//这个for循环就是用来扩容最主要的方法了
for (int i = 0, bound = 0;;) {
Node<K,V> f; int fh;
//该while循环的作用有两点 1.将扩容任务根据步长分块 2.确定本次循环要rehash的下标节点(rehash与扩容意义相同)
while (advance) {
int nextIndex, nextBound;
//i为要进行rehash的下标,bound为分块任务的边界,finishing代表扩容完毕
//每个线程在第一次进行该if判断时,bound和i都为0,finishing为false,不进第一个if
//在第一个else if时将transferIndex赋值给nextIndex,不进第一个else if
//在第二个else if,将transferIndex更新为nextIndex-stride
//假设nextIndex为32,stride为16。代表数组长度32,有32个下标要倒序依次rehash,则任务分为两块(32-16,16-0)
//第一个线程会处理32-16的任务。
//第二个线程来的时候发现transferIndex为16,根据步长他会处理16-0的任务
//如果没有其余的线程帮助扩容,则第一个线程会再完成第一块任务后,再获取下一块任务直至都rehash完
if (--i >= bound || finishing)
advance = false;
else if ((nextIndex = transferIndex) <= 0) {
i = -1;
advance = false;
}
else if (U.compareAndSwapInt
(this, TRANSFERINDEX, nextIndex,
nextBound = (nextIndex > stride ?
nextIndex - stride : 0))) {
bound = nextBound;
i = nextIndex - 1;
advance = false;
}
}
//在rehash任务都处理完之前不会进入该if判断,该if方法会进入两次
if (i < 0 || i >= n || i + n >= nextn) {
int sc;
//第一次进入的时候finishing为false
//第二次进入的时候finishing为true,代表扩容已经结束,将新的nextTab赋值给table,并将sizeCtl设置为table长度的0.75倍
if (finishing) {
nextTable = null;
table = nextTab;
sizeCtl = (n << 1) - (n >>> 1);
return;
}
//第一次进入的时候,会将finishing设置为true,并将i重新赋值为原table大小
//假如n=32,则会将最外面的for循环再循环32遍检查各个下标作为是否都已经扩容过了
if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
return;
finishing = advance = true;
i = n;
}
}
//如果该下标内没有数据,则将该下标内放入ForwardingNode,代表该下标rehash结束
else if ((f = tabAt(tab, i)) == null)
advance = casTabAt(tab, i, null, fwd);
//如果该下标的hash值为-1(即ForwardingNode的hash值),代表已经rehash结束,继续下一次循环
else if ((fh = f.hash) == MOVED)
advance = true;
else {
//真正的扩容,锁住该下标的第一个node
synchronized (f) {
//再次判断该node有没有变
if (tabAt(tab, i) == f) {
Node<K,V> ln, hn;
//如果该node的hash值>=0, 代表该下标内是链表
if (fh >= 0) {
int runBit = fh & n;
Node<K,V> lastRun = f;
for (Node<K,V> p = f.next; p != null; p = p.next) {
int b = p.hash & n;
if (b != runBit) {
runBit = b;
lastRun = p;
}
}
if (runBit == 0) {
ln = lastRun;
hn = null;
}
else {
hn = lastRun;
ln = null;
}
//遍历链表,将链表内的node重新分配到新nextTab的i位置和i+n位置
//原始的链表会倒序分到两个下标内,越靠后的node在新的map的链表里越靠前
for (Node<K,V> p = f; p != lastRun; p = p.next) {
int ph = p.hash; K pk = p.key; V pv = p.val;
if ((ph & n) == 0)
ln = new Node<K,V>(ph, pk, pv, ln);
else
hn = new Node<K,V>(ph, pk, pv, hn);
}
//更新新的nextTab,并将原table的该下标位置放入ForwardingNode
setTabAt(nextTab, i, ln);
setTabAt(nextTab, i + n, hn);
setTabAt(tab, i, fwd);
advance = true;
}
//该下标内是红黑树
else if (f instanceof TreeBin) {
TreeBin<K,V> t = (ConcurrentHashMap.TreeBin<K,V>)f;
TreeNode<K,V> lo = null, loTail = null;
TreeNode<K,V> hi = null, hiTail = null;
int lc = 0, hc = 0;
//将原树rehash到两个新树里
for (Node<K,V> e = t.first; e != null; e = e.next) {
int h = e.hash;
TreeNode<K,V> p = new TreeNode<K,V>
(h, e.key, e.val, null, null);
if ((h & n) == 0) {
if ((p.prev = loTail) == null)
lo = p;
else
loTail.next = p;
loTail = p;
++lc;
}
else {
if ((p.prev = hiTail) == null)
hi = p;
else
hiTail.next = p;
hiTail = p;
++hc;
}
}
//如果树的node数量<=6,则将红黑树变为链表
ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
(hc != 0) ? new TreeBin<K,V>(lo) : t;
hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
(lc != 0) ? new TreeBin<K,V>(hi) : t;
//将新树或链表放到新的table对应的下标里
//并将原table的该下标位置放入ForwardingNode
setTabAt(nextTab, i, ln);
setTabAt(nextTab, i + n, hn);
setTabAt(tab, i, fwd);
advance = true;
}
}
}
}
}
}
最后的扩容方法参考的博文:有点难理解,有兴趣的同学可以认真看完分析:
参考文献: