HashMap 是 Java 中常用的数据结构,它提供了高效的键值对存储和查询功能。在使用 HashMap 时,合理设置初始化容量和了解扩容机制是很重要的,可以提高性能和节省内存。本文将深入探讨 HashMap 的初始化容量和扩容机制,并通过源码解析和实例说明来帮助读者理解。
在《阿里巴巴开发手册》中,是这么建议的:
HashMap的初始化容量并不是我们需要放多少元素,就设置为多少。比如,我现在想放入15个元素,那么我应该new HashMap<>(15)吗?这是不准确的。
原因有两点,首先,当我们使用HashMap(int initialCapacity)来初始化容量的时候,HashMap并不会使用我们传进来的initialCapacity直接作为初识容量,JDK会默认帮我们计算一个相对合理的值当做初始容量。所谓的合理值其实就是大于等于传入初始化容量的最小二次幂。也就是说,如果设置初始化容量为15,JDK会帮我们创建一个容量为16的HashMap。
其次,HashMap中有一个扩容机制。HashMap中有一个参数loadFactor(负载因子),负载因子是用于确定何时触发扩容的因子,默认为 0.75,可以指定为其他值。
int initialCapacity = 16;
float loadFactor = 0.75f;
HashMap<String, Integer> hashMap = new HashMap<>(initialCapacity, loadFactor);
HashMap 在添加键值对时,如果HashMap中的元素个数达到了负载因子所允许的容量,即当HashMap中的元素个数(size)超过 threshold = loadFactor * capacity时,就会触发扩容。扩容会将哈希表的容量扩大为原来的两倍,并重新计算每个元素在新的哈希表中的位置。
以下是源码中进行扩容的部分:
int newCapacity = oldCapacity << 1; // 扩容为原来的两倍
transient Node<K, V>[] newTab = (Node<K, V>[]) new Node[newCapacity];
那么,如果我们指定初始容量为15就会出现什么问题呢?JDK会帮我们创建一个容量为16的HashMap,那么它的容量threshold = 0.75 * 16 = 12,那么我们添加到第12个元素的时候,HashMap就会进行扩容操作,这显然会增加不必要的耗时。
那么,该怎么设置初始容量才合理呢?
我们可以参考putAll()方法中调用的putMapEntries()方法,将容量设置为:
(int)(((float)expectedCapacity / loadFactor) + 1.0F)
这是源码:
public void putAll(Map<? extends K, ? extends V> m) {
putMapEntries(m, true);
}
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
int s = m.size();
if (s > 0) {
if (table == null) { // pre-size
float ft = ((float)s / loadFactor) + 1.0F;
int t = ((ft < (float)MAXIMUM_CAPACITY) ?
(int)ft : MAXIMUM_CAPACITY);
if (t > threshold)
threshold = tableSizeFor(t);
}
else if (s > threshold)
resize();
for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
K key = e.getKey();
V value = e.getValue();
putVal(hash(key), key, value, false, evict);
}
}
}
那回到上面的问题,我们通过expectedCapacity / 0.75F + 1.0F计算,15 / 0.75 + 1 = 21 ,21经过JDK处理之后,会被设置成32,这就大大的减少了扩容的几率。
当然,这样操作可以保证一定的性能,但是会牺牲内存。其实,负载因子的大小本身就是时间和空间上平衡的一个选择,这也是面试中经常会被问到的一个问题。
- 如果内存空间很多而又对时间效率要求很高,可以降低负载因子loadFactor的值。
- 相反,如果内存空间紧张而又对时间效率要求不高,可以增加负载因子loadFactor的值。
当然,有小伙伴可能会问,我该怎么获取HashMap的容量capacity以及阈值threshold呢?
利用反射的机制,获取HashMap的非public方法capacity()和非public属性threshold。
下面附上代码:
public static void main(String[] args) throws Exception {
//指定初始容量15来创建一个HashMap
HashMap m = new HashMap(15);
//获取HashMap整个类
Class<?> mapType = m.getClass();
//获取指定属性,也可以调用getDeclaredFields()方法获取属性数组
Field threshold = mapType.getDeclaredField("threshold");
//将目标属性设置为可以访问
threshold.setAccessible(true);
//获取指定方法,因为HashMap没有容量这个属性,但是capacity方法会返回容量值
Method capacity = mapType.getDeclaredMethod("capacity");
//设置目标方法为可访问
capacity.setAccessible(true);
//打印刚初始化的HashMap的容量、阈值
System.out.println("容量:"+capacity.invoke(m) + " 阈值:"+threshold.get(m));
}
参考文章:HashMap容量及阈值获取