我们这里主要讨论在多线程环境下,这三个容器的区别.
1. HashMap
HashMap是我们十分熟悉的容器,它不能确保线程安全.(可以通过源码去观察,发现它的方法中没有加锁操作).
2. HashTable
HashTable是带锁的,但是并不推荐使用.HashTable的加锁是简单粗暴地给每个方法都加上了synchronized,就相当于是针对this加锁.只要针对HashTable上的元素进行操作,就都会涉及到锁冲突.
3. ConcurrentHashMap
concurrentHashMap就是HashTable的上位替代,它做出了三点优化.
3.1 使用"锁桶"方式来代替"一把全局锁"
我们都知道HashMap底层是使用一个个链表来构成一个个哈希桶.
ConcurrentHashMap使用"锁桶"方式来代替"一把全局锁".当两个元素同时放入两个桶时,就不会发生锁冲突了.这样的操作的效率比"全局锁"的操作快得多.
3.2 引入CAS
对于HashMap的size,即使我们插入的元素是不同链表上的元素,也会涉及多线程修改同一个变量.
ConcurrentHashMap通过CAS的方式来修改size,避免了加锁操作.
3.3 特殊优化扩容操作
在HashMap中,如果负载因子太大了,就需要扩容.扩容本身是一个比较重量比较低效的操作.对于普通的HashMap,要在一次put中完成扩容,就会使put操作非常卡.
ConcurrentHashMap就会在扩容时,搞两份空间,一份是扩容前的空间,一份时扩容后的空间,接下来每次基本操作就会把一部分数据从旧空间搬到新空间.
搬的过程中:
1. 插入 => 插入到新的上面
2. 删除 => 新的旧的都要删除
3. 查找 => 新的旧的都要查找