概述
- HashMap 是 Java 中重要的数据结构,融合了散列算法、碰撞解决策略、动态扩缩容机制及红黑树等高级算法。
- 在并发编程中,涉及分段锁、CAS操作和扩容安全性等议题。
- 掌握 HashMap 对于理解 Java 程序性能优化至关重要。
数据结构
- 主要解读 JDK1.8 之后的 HashMap,与 JDK1.7 以前的设计进行对比。
常量
- DEFAULT_INITIAL_CAPACITY: 默认初始容量,必须是 2 的幂,这里为 16。
- MAXIMUM_CAPACITY: 最大容量,也必须是 2 的幂,最大为 2^30。
- DEFAULT_LOAD_FACTOR: 默认负载因子为 0.75,是性能和空间利用率的权衡。
- TREEIFY_THRESHOLD: 当桶中的节点数达到此值(8)时,链表转换为红黑树。
- UNTREEIFY_THRESHOLD: 反树化阈值,小于 TREEIFY_THRESHOLD,最多为 6。
- MIN_TREEIFY_CAPACITY: 最小树化容量为 64,至少是 TREEIFY_THRESHOLD 的 4 倍。
位运算
- 容量常量使用位运算表示,确保容量是 2 的幂。
- 索引计算公式:
index = hashCode & (capacity - 1)
。
泊松分布
- 负载因子 0.75 基于泊松分布的计算,减少哈希碰撞概率。
边缘抖动
- 树化和反树化阈值设置为不同,避免节点数量波动导致性能问题。
树化利弊
- 红黑树转换不一定总是性能更优,需要考虑维护成本和空间利用率。
结构
- HashMap 由数组、链表和红黑树组成。
- 节点定义包括
hash
,key
,value
,next
。
散列算法
- 将输入转换为固定大小数值,具有确定性、高效性、均匀分布和不可逆性。
哈希碰撞
- 不同输入可能产生相同哈希值,需采用策略解决。
扩容与缩容
- JDK1.8 中的扩容策略为“先插入,再扩容”,扩容时创建新数组并重新分配元素。
尾插法与头插法
- JDK1.8 采用尾插法,避免多线程环境中的死锁和链表循环问题。
红黑树
- 自平衡的二叉搜索树,具有特定特性,保证操作的最坏时间复杂度为 O(log n)。
并发安全
- HashMap 非线程安全。
- HashTable 通过同步方法保证线程安全,但性能较差。
- ConcurrentHashMap 引入分段锁和 CAS 操作提高并发性能。
ConcurrentHashMap(JDK 1.7 & 1.8)
- JDK 1.7 引入分段锁机制,JDK 1.8 进一步优化,使用 CAS 操作减少锁开销。
总结
- HashMap 高效适用于非并发场景,需使用线程安全的实现在并发场景。
- ConcurrentHashMap 通过锁优化提高并发性能。
- 红黑树在查找和排序中广泛使用,提供高性能操作。