- 简单介绍
ConcurrentHashMap是一个支持并发的哈希表,并发检索(高并发时),都需要使用ConcurrentHashMap。
ConcurrentHashMap所有操作都是线程安全的,检索操作可以不用获取锁。
一、类的继承关系
public class ConcurrentHashMap<K,V> extends AbstractMap<K,V>
implements ConcurrentMap<K,V>, Serializable {}
ConcurrentMap接口是Map接口的子接口,继承AbstractMap抽象类(定义一些基本操作),实现Serializable接口,可以被序列化。
二、类的属性
- sizeCtl:table初始化和扩容需要用到的一个变量
sizeCtl为 -1:代表table正在初始化
sizeCtl为 -N:代表N-1个线程正在进行扩容
其他情况:
sizectl为正数时
1)如果table未初始化,sizectl表示要初始化的大小
2)如果table初始化完成,sizectl表示table的容量(默认0.75*table.size) - concurrencyLevel 在 jdk1.8 的意义改变,并不代表当前所允许的并发数,只是用来sizeCtl大小,在 jdk1.8 的并发
三、构造函数
public ConcurrentHashMap() {
}
- 上面所示代码是默认构造函数,创建了一个空表,说明ConcurrentHashMap初始化操作在第一次put时完成。
public ConcurrentHashMap(int initialCapacity,
float loadFactor, int concurrencyLevel) {
if (!(loadFactor > 0.0f) || initialCapacity < 0 || concurrencyLevel <= 0)
throw new IllegalArgumentException();
if (initialCapacity < concurrencyLevel) // Use at least as many bins
initialCapacity = concurrencyLevel; // as estimated threads
long size = (long)(1.0 + (long)initialCapacity / loadFactor);
int cap = (size >= (long)MAXIMUM_CAPACITY) ?
MAXIMUM_CAPACITY : tableSizeFor((int)size);
this.sizeCtl = cap;
}
- 代码中的concurrencyLevel在jdk1.8的意义改变,并不代表当前所允许的并发数,只是用来确定sizectl(初始化时使用)的大小。因为在jdk1.8的并发控制针对具体的桶而言,所以有多少个桶,就有多少个并发数。
- 构造函数只是进行sizectl的初始化,表示table初始化大小
四、put / get
put方法:
final V putVal(K key, V value, boolean onlyIfAbsent) {
//ConcurrentHashMap中,键和值不能为空
if (key == null || value == null) throw new NullPointerException();//如果键或值为空,抛出异常
int hash = spread(key.hashCode());
int binCount = 0;//表示当前桶中的节点个数
for (Node<K,V>[] tab = table;;) {
//无限循环(在多线程环境下)(表示如果失败,要不断尝试)
Node<K,V> f; int n, i, fh;
if (tab == null || (n = tab.length) == 0)
//表示 表为空 或者 表的长度为0,要初始化表
tab = initTable();//初始化表
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
//表不为空,该桶位置为空时
if (casTabAt(tab, i, null,
new Node<K,V>(hash, key, value, null)))
//CAS方式插入一个新的Node
break; // no lock when adding to empty bin
}
else if ((fh = f.hash) == MOVED)
//该节点的hash值为 Moved,说明当前节点是ForwardingNode
//意味着有其他线程在进行扩容,则一起进行扩容
tab = helpTransfer(tab, f);//帮助扩容进行节点转移
else {
V oldVal = null;
synchronized (f) {
//加锁同步,针对首个节点进行加锁操作(力度更小)
if (tabAt(tab, i) == f) {
//找到 table表下标为 i的节点
if (fh >= 0) {
//如果fh>=0,该节点是一个正常节点
binCount = 1;//该桶位置的节点个数
for (Node<K,V> e = f;; ++binCount) {
//无限循环,相当于在进行一个自旋操作
K ek;
//判断当前节点的hash与将要插入节点hash的key值是否相等
//如果相等,新值覆盖旧值
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) {
oldVal = e.val;
if (!onlyIfAbsent)
e.val = value;
break;
}
Node<K,V> pred = e;
if ((e = e.next) == null) {
//遍历到最后一个节点
pred.next = new Node<K,V>(hash, key, value, null); //尾插法插入一个新节点
break;
}
}
}
else if (f instanceof TreeBin) {
//判断节点类型是否是红黑树节点
Node<K,V> p;
binCount = 2;
if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key, value)) != null) {
oldVal = p.val;
if (!onlyIfAbsent)
p.val = value;
}
}
}
}
if (binCount != 0) {
//判断是否大于阈值,大于转为树形结构
if (binCount >= TREEIFY_THRESHOLD)
treeifyBin(tab, i);
if (oldVal != null)
return oldVal;
break;
}
}
}
//增加binCount容量,检查增加后当前哈希表是否需要进行扩容操作
addCount(1L, binCount);
return null;
}
- initTable() 初始化表
private final Node<K,V>[] initTable() {
//初始化桶
Node<K,V>[] tab; int sc;
//再次判断,如果满足while条件,进行初始化,反之,返回table。
while ((tab = table) == null || tab.length == 0) {
//用while循环,不用if:执行过程中有可能发生线程切换。
//如果其他线程已经初始化table。再回到当前线程继续执行时,会再次判断是否满足条件,若满足接着执行,不满足,直接return。
if ((sc = sizeCtl) < 0)
//若为负数,则说明当前有多个线程同时访问该Map。
Thread.yield(); // lost initialization race; just spin
else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
//判断当前位置的sizectl是否与sc相等,若相等,把-1赋值到当前位置
//此处 原值A:sc 新值B:-1
try {
if ((tab = table) == null || tab.length == 0) {
//若sc大于0,表示要初始化的大小,若小于0,取默认容量16进行初始化
int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
table = tab = nt;
sc = n - (n >>> 2);//sc = 3/4*n
}
} finally {
sizeCtl = sc;
}
break;
}
}
return tab;
}
上述方法中的U是unsafe的一个引用:
private static final sun.misc.Unsafe U;
- Unsafe类是用于帮助Java访问操作系统底层资源的类。如分配内存、释放内存,该类中全部都是native方法,通过Unsafe,Java应用层的语言才具有了底层操作的能力。
- compareAndSwapInt CAS操作
1) CAS是乐观锁技术,当多个线程尝试使用CAS同时去更新同一个变量时,只有其中一个线程能更新变量的值,其他线程都失败,失败的线程并不会阻塞,而是被告知本次竞争失败,可再次尝试。
2)CAS操作是一个原子性的操作。也就是说:一旦开始,要么全部成功,要么全部失败。在执行的过程中,不会被其他线程所打断。
3)CAS操作逻辑:如果内存位置V的值与预期原值A相匹配,那么处理器自动更新该位置为新值B,否则处理器不会进行任何操作。 - tabAt 方法:
static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {
return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE);
}
static final <K,V> boolean casTabAt(Node<K,V>[] tab, int i,
Node<K,V> c, Node<K,V> v) {
return U.compareAndSwapObject(tab, ((long)i << ASHIFT) + ABASE, c, v);
}
static final <K,V> void setTabAt(Node<K,V>[] tab, int i, Node<K,V> v) {
U.putObjectVolatile(tab, ((long)i << ASHIFT) + ABASE, v);
}
- 获取某一位置的元素没有直接用table[index],而是tabAt(table,index)。
- Java内存模型,每一个线程都有一个自己的工作内存,里面存table的副本。table本身用volatile修饰,但是不能够保证线程每次拿到的table里面都是最新的元素,因为volatile只能够保证引用可见,Unsafe.getObjectVolatile可以直接获取指定内存的数据,这就可以保证每次拿到的数据都是最新的。
get方法:
public V get(Object key) {
Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
int h = spread(key.hashCode());
if ((tab = table) != null && (n = tab.length) > 0 &&
(e = tabAt(tab, (n - 1) & h)) != null) {
if ((eh = e.hash) == h) {
if ((ek = e.key) == key || (ek != null && key.equals(ek)))
return e.val;
}
else if (eh < 0)
return (p = e.find(h, key)) != null ? p.val : null;
while ((e = e.next) != null) {
if (e.hash == h &&
((ek = e.key) == key || (ek != null && key.equals(ek))))
return e.val;
}
}
return null;
}
- get方法没有加锁,如何保证读到的数据不是脏数据呢?
当前value和next的值都是用volatile修饰的,在多线程环境下某一个线程A修饰节点的value或者新增节点对其他线程都是可见的。(能够保证它的可见性,也就能够保证在没有加锁的情况下读到的数据不是脏数据)