Java 集合框架层级图
Java Map 接口层级图
HashMap 扩容与树化机制
HashMap
是一个装内部类 Node(它的) 的数组(bucket),数组初始大小为16, 加载因子(数组中元素个数/数组长度)默认为0.75. 大于加载因子就会 double 数组的大小。
同时满足2个条件:1、当一个 bucket 中冲突的数量大于 TREEIFY_THRESHOLD = 8
. 2、数组的长度要大于 MIN_TREEIFY_CAPACITY = 64
. 会将链表结构改成红黑树结构来处理冲突。此时,查找的时间复杂度会降低到 O(log N),但是会增加插入的成本。如果满足条件1,不满足2会将数组扩容。
HashMap 扩容是采用的是 power-of-two expansion. 如果表长不是2的幂,计算 key 的索引下标需要取余数(计算效率低)并且要保证 key 是非负的,hashcode(key) % 数组长度
; 而如果数组大小为2的幂,就可以用 AND 操作非常高效的得到 key 的索引下标:index = hashCode & (array length-1)
数组扩容,但 hashcode 并没有变,这会导致同样一个 key 在扩容前后位置不一样。比如数组长是16, hashcode 为21,当扩容以后数组长变为32, hashcode 为21 的位置就变了。因此,Rehashing 的过程需要遍历扩容前的数组中的每个元素,用新表长计算每个元素的 index,然后将其插入到新表中。
Hashmap VS Hashtable VS ConcurrentHashMap
先比较 Hashmap 与 Hashtable:
- Hashtable 是线程安全的,而 Hashmap 不是
- Hashtable 的 key 与 value 不允许为 NULL(在运行时会抛空指针异常),而 Hashmap 可以
再比较 Hashtable 与 ConcurrentHashMap:
- Hashtable 锁整个对象,而 ConcurrentHashMap 只锁 bucket. 用房子做比喻,Hashtable 相当于锁了整个大门,而 ConcurrentHashMap 只锁了某个房门。类似于 MySQL 的表锁和行锁。
- 关于 Iterator:Hashtable 是 fail-fast 的,而 ConcurrentHashMap 是 fails-safe (iterator will make a copy of the internal data structure) 的. Fail-fast 是指在遍历时,如果其它线程修改集合,会抛出
ConcurrentModificationException
.
总结:Hashtable 一无是处!