HashMap 结构图
为什么 HashMap 是线程不安全的?
同时put碰撞导致数据丢失
同时put扩容导致数据丢失
死循环造成的CPU100%
红黑树
每个节点要么是红色,要么是黑色,但根节点永远是黑色的红色节点不能连续(也即是,红色节点的孩子和父亲都不能是红色)
从任一节点到其子树中每个叶子节点的路径都包含相同数量的黑色节点
所有的叶节点都是是黑色的
JDK1.7 的 ConcurrentHashMap 实现和分析
Java 7 中的 ConcurrentHashMap 最外层是多个 segment,每个 segment 的底层数据结构与 HashMap 类似,仍然是数组和链表组成的拉链法
每个 segment 独立上 ReentrantLock 锁,每个 segment 之间互不影响,提高了并发效率
ConcurrentHashMap 默认有 16 个 Segments,所以最多可以同时支持 16 个线程并发写(操作分别分布在不同的Segment.上)。这个默认值可以在初始化的时候设置为其他值,但是一旦初始化以后是不可以扩容的
JDK1.8 的 ConcurrentHashMap 实现和分析
putVal流程
判断 key value 不为空
计算 hash 值
根据对应位置节点的类型来赋值或者 helpTransfer,或者增长链表,或者给红黑树增加节点
检查满足阈值就“红黑树化"
返回 oldVal
public V put(K key, V value) {
return putVal(key, value, false);
}
/** Implementation for put and putIfAbsent */
final V putVal(K key, V value, boolean onlyIfAbsent) {
// HashMap 允许 key 为 null
if (key == null || value == null) throw new NullPointerException();
int hash = spread(key.hashCode());
int binCount = 0;
for (Node<K,V>[] tab = table;;) {
Node<K,V> f; int n, i, fh;
// tab 初始化操作
if (tab == null || (n = tab.length) == 0)
tab = initTable();
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
// CAS 操作成功 break
if (casTabAt(tab, i, null,
new Node<K,V>(hash, key, value, null)))
break; // no lock when adding to empty bin
}
// CAS 操作没有成功判断 hash 值是否为 MOVED,特殊的节点代表正在扩容
else if ((fh = f.hash) == MOVED)
tab = helpTransfer(tab, f);
// 槽点有值进入 else
else {
V oldVal = null;
synchronized (f) {
if (tabAt(tab, i) == f) {
if (fh >= 0) {
binCount = 1;
for (Node<K,V> e = f;; ++binCount) {
K ek;
// 根据 hash 值找到对应位置,如果 key 存在返回
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) {
oldVal = e.val;
if (!onlyIfAbsent)
e.val = value;
break;
}
Node<K,V> pred = e;
// 新创建一个节点,放在链表最后退出循环
if ((e = e.next) == null) {
pred.next = new Node<K,V>(hash, key,
value, null);
break;
}
}
}
// 走到这里说明变为红黑树 putTreeVal 把值放到树中去并返回 oldVal
else if (f instanceof TreeBin) {
Node<K,V> p;
binCount = 2;
if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
value)) != null) {
oldVal = p.val;
if (!onlyIfAbsent)
p.val = value;
}
}
}
}
// 完成添加操作判断是否要把链表转为树
if (binCount != 0) {
if (binCount >= TREEIFY_THRESHOLD)
treeifyBin(tab, i);
if (oldVal != null)
return oldVal;
break;
}
}
}
addCount(1L, binCount);
return null;
}
get流程
计算 hash 值
找到对应的位置,根据情况进行:
直接取值
红黑树里找值
遍历链表取值
返回找到的结果
public V get(Object key) {
Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
int h = spread(key.hashCode());
if ((tab = table) != null && (n = tab.length) > 0 &&
(e = tabAt(tab, (n - 1) & h)) != null) {
if ((eh = e.hash) == h) {
if ((ek = e.key) == key || (ek != null && key.equals(ek)))
return e.val;
}
else if (eh < 0)
return (p = e.find(h, key)) != null ? p.val : null;
while ((e = e.next) != null) {
if (e.hash == h &&
((ek = e.key) == key || (ek != null && key.equals(ek))))
return e.val;
}
}
return null;
}
ConcurrentHashMap 1.7 和 1.8 的对比
数据结构:并发度由原来默认的 16 变为每个节点都独立,并发度提高了
Hash 碰撞:和 HashMap 一样
并发安全:1.7 中用的是分段锁 segment 它实现 ReentrantLock,而 1.8 用的 CAS + Synchronized
查询复杂度:拉链法长度超过 8 要转为红黑树,时间复杂度由 O(N) 转为 O(logN)
为什么超过 8 要转为红黑树:红黑树的每一个节点占用空间是链表的两倍,泊松分布的概率函数计算得出结论随着链表长度增长,冲突发生的概率越来越小到 8 的时候已经是千万分之一了,正常的情况下链表的长度不会达到 8,所以为了避免极端情况下的效率链表的长度达到 8 会将之转为红黑树