1 存储结构
- 内部包含了一个 Entry 类型的数组 table。
transient Entry[] table;
- Entry包含四个字段,分别是键(K)、值(V)、键的哈希值(hash),以及下一个结点的引用(next);
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
}
- 从next字段可以看出Entry是一个链表;
- 因此数组table的每个位置可以看作一个桶,每个桶存放一个链表,HashMap 使用拉链法来解决哈希冲突,同一个链表中存放哈希值相同的Entry;
2 拉链法工作原理
HashMap<String, String> map = new HashMap<>();
map.put("K1", "V1");
map.put("K2", "V2");
map.put("K3", "V3");
- 新建一个 HashMap,数组 table默认大小为16(2的n次幂),最大容量为2 ^ 30;
- 插入 <K1,V1> 键值对,先计算 K1 的 hashCode 为 115,使用除留余数法得到所在的桶下标 115 % 16 = 3;
- 插入 <K2,V2> 键值对,先计算 K2 的 hashCode 为 118,使用除留余数法得到所在的桶下标 118 % 16 = 6;
- 插入 <K3,V3> 键值对,先计算 K3 的 hashCode 为 118,使用除留余数法得到所在的桶下标 118 % 16 = 6,插在 <K2,V2> 前面;
3 数组扩容
- 设 HashMap 的 table 长度为 M,需要存储的键值对数量为 N,如果哈希函数满足均匀性的要求,那么每条链表的长度大约为N/M,因此平均查找次数的复杂度为 O(N/M);
- 为了让查找的成本降低,应该尽可能使得 N/M 尽可能小,因此需要保证 M 尽可能大,也就是说 table 要尽可能大。 HashMap采用动态扩容来根据当前的 N 值来调整 M 值,使得空间效率和时间效率都能得到保证;
- 默认装载因子loadFactor为0.75,其乘以数组大小capacity得到threshold,如果键值对数量size大于threshold,需要扩容,扩容为原来的2倍(加载因子过小,数组空间利用率降低;过大,会增大hash冲突的概率,影响查询效率);
- 扩容后,需要重新计算桶下标,把键值对重新放到对应的桶上;
4 链表转化红黑树
- 链表长度>8且数组容量>=64时,链表会转化为红黑树;
- 转化的过程:先遍历链表 ,将链表的节点转化为红黑树的节点,然后将链表转化为红黑树;
- 红黑树中元素个数<=6就退化为链表;