1、为什么引出ConcurrentHashMap?
1.1、 因为在多线程环境下,使用HashMap进行put操作会引起死循环,导致CPU利用率接近100%,所以在并发情况下
不能使用HashMap。
1.2、 为保证线程安全那为什么不使用HashTable容器?
HashTable容器使用synchronized来保证线程安全,但是在线程竞争激烈的情况下HashTable的效率非常低下,
因为当一个线程访问HashTable的同步方法时,其他线程访问HashTable的同步方法时,可能会进入阻塞或者轮询状态。
eg:线程1使用Put进行添加元素,线程2 不但不能使用put方法添加,并且也不能使用get方法来获取元素,所以竞争越激烈效率越低。
2、锁分段技术
HashTable容器在竞争激烈的并发环境下表现出效率低些的原因,是因为访问HashTable的线程都必须竞争同一把锁,那假如容器里有多把锁,每一把锁用于锁容器其中的一部分数据,那么当多线程访问容器里不能数据段的数据时,线程间就不能存在锁竞争,从而可以有效的提高并发访问效率,这就是ConcurrentHashMap所使用的锁分段技术,首先将数据分成一段一段的存储,然后给每一段数据配一把锁,当一个线程占用锁访问一个端数据的时候,其它段的数据也能被其他线程访问。有些方法需要跨段,比如
size()和containsValue(),他们可能需要锁定整个表而不是仅仅某个段,这需要按顺序锁定所有段,操作完毕后,又按照顺序释放所有段的锁。这里“”锁顺序“是很重要的,否则极有可能出现死锁,在ConcurrentHashMap内部,段数据是final的,并且其成员变量也是final的,但是仅仅将数据声明为final的并不保证数组成员也是final的,这需要实现上的保证。这可以确保不会出现死锁,因为获得锁的顺序是固定的。
ConcurrentHashMap是Segment数组结构和HashEntry链表结构组成。Segment 是一种可重入锁ReentrantLock,在ConcurrentHashMap里扮演锁的角色,HashEntry则用于存储键值对数据。一个ConcurrentHashMap里包含一个Segment数组,Segment的结构和HashMap类似,是一种数组和链表结构,一个Segment里包含一个HashEntry数组,每个HashEntry是一个链表结构的元素,每个Segment守护者一个HashEntry数组里的元素,当对HashEntry数组的数据进行修改时,必须首先获取它对应的Segment锁。
源码解析:这里就不分析了。