线程不安全的HashMap
因为多线程环境下,使用HashMap进行put操作会引起死循环,导致CPU利用率接近100%,所以在并发情况下不能使用HashMap
效率低下的HashTable容器
HashTable容器使用synchronized来保证线程安全,但在线程竞争激烈的情况下HashTable的效率非常低下。因为当一个线程访问HashTable的同步方法时,其他线程访问HashTable的同步方法时,可能会进入阻塞或轮询状态。如线程1使用put进行添加元素,线程2不但不能使用put方法添加元素,并且也不能使用get方法来获取元素,所以竞争越激烈效率越低。
锁分段技术
HashTable容器在竞争激烈的并发环境下表现出效率低下的原因是所有访问HashTable的线程都必须竞争同一把锁,那假如容器里有多把锁,每一把锁用于锁容器其中一部分数据,那么当多线程访问容器里不同数据段的数据时,线程间就不会存在锁竞争,从而可以有效的提高并发访问效率,这就是ConcurrentHashMap所使用的锁分段技术,首先将数据分成一段一段的存储,然后给每一段数据配一把锁,当一个线程占用锁访问其中一个段数据的时候,其他段的数据也能被其他线程访问。
ConcurrentHashMap的结构
我们通过ConcurrentHashMap的类图来分ConcurrentHashMap的结构。
ConcurrentHashMap是由Segment数组结构和HashEntry数组结构组成。Segment是一种可重入锁ReentrantLock,在ConcurrentHashMap里扮演锁的角色,HashEntry则用于存储键值对数据。一个ConcurrentHashMap里包含一个Segment数组,Segment的结构和HashMap类似,是一种数组和链表结构, 一个Segment里包含一个HashEntry数组,每个HashEntry是一个链表结构的元素, 每个Segment守护者一个HashEntry数组里的元素,当对HashEntry数组的数据进行修改时,必须首先获得它对应的Segment锁。
ConcurrentHashMap包含了两个静态内部类:
•HashEntry
•Segment
ConcurrentHashMap中的Segment就相当于一个小的HashTable,每个HashTable由多个HashEntry组成。每个Segment持有自己的锁,只要修改操作发生在不同的Segment上,就可以并发执行
HashEntry
HashEntry用来封装映射表的键值对.
Segment
Segment用来充当锁的角色,是一种可重入锁ReentrantLock利用了锁分离技术来保护不同的segment.
具体实现
每个Segment对象守护整个散列表的若干个桶
每个桶由若干个HashEntry对象连接起来的
ConcurrentHashMap是弱一致的
ConcurrentHashMap进行操作时,put操作将一个元素加入到底层数据结构后,get可能在某段时间内还看不到这个元素。
ConcurrentHashMap的弱一致性主要是为了提升效率,是一致性与效率之间的一种权衡。
要成为强一致性,就得到处使用锁,甚至是全局锁,这就与Hashtable和同步的HashMap一样了
锁分离
每个Segment持有自己的锁,只要修改操作发生在不同的Segment上,就可以并发执行.
跨Segment的锁
有些方法需要跨Segment执行:size()、containsValue(),他们可能需要锁定整个表而不仅仅是某个Segment.需要按顺序锁定所有的段,操作完毕后,需要按顺序释放所有段的锁(确保不发生死锁)。
参考:
http://www.infoq.com/cn/articles/ConcurrentHashMap/