关于HashMap初始化容量以及HashMap扩容那些事儿

HashMap 是 Java 中常用的数据结构,它提供了高效的键值对存储和查询功能。在使用 HashMap 时,合理设置初始化容量和了解扩容机制是很重要的,可以提高性能和节省内存。本文将深入探讨 HashMap 的初始化容量和扩容机制,并通过源码解析和实例说明来帮助读者理解。

        在《阿里巴巴开发手册》中,是这么建议的:

HashMap的初始化容量并不是我们需要放多少元素,就设置为多少。比如,我现在想放入15个元素,那么我应该new HashMap<>(15)吗?这是不准确的。

原因有两点,首先,当我们使用HashMap(int initialCapacity)来初始化容量的时候,HashMap并不会使用我们传进来的initialCapacity直接作为初识容量,JDK会默认帮我们计算一个相对合理的值当做初始容量。所谓的合理值其实就是大于等于传入初始化容量的最小二次幂。也就是说,如果设置初始化容量为15,JDK会帮我们创建一个容量为16的HashMap。

其次,HashMap中有一个扩容机制。HashMap中有一个参数loadFactor(负载因子),负载因子是用于确定何时触发扩容的因子,默认为 0.75,可以指定为其他值。

int initialCapacity = 16;
float loadFactor = 0.75f;
HashMap<String, Integer> hashMap = new HashMap<>(initialCapacity, loadFactor);

HashMap 在添加键值对时,如果HashMap中的元素个数达到了负载因子所允许的容量,即当HashMap中的元素个数(size)超过 threshold = loadFactor * capacity时,就会触发扩容。扩容会将哈希表的容量扩大为原来的两倍,并重新计算每个元素在新的哈希表中的位置。

以下是源码中进行扩容的部分:

int newCapacity = oldCapacity << 1; // 扩容为原来的两倍
transient Node<K, V>[] newTab = (Node<K, V>[]) new Node[newCapacity];

那么,如果我们指定初始容量为15就会出现什么问题呢?JDK会帮我们创建一个容量为16的HashMap,那么它的容量threshold = 0.75 * 16 = 12,那么我们添加到第12个元素的时候,HashMap就会进行扩容操作,这显然会增加不必要的耗时。

那么,该怎么设置初始容量才合理呢?

我们可以参考putAll()方法中调用的putMapEntries()方法,将容量设置为:

(int)(((float)expectedCapacity / loadFactor) + 1.0F)

这是源码:

public void putAll(Map<? extends K, ? extends V> m) {
    putMapEntries(m, true);
}

final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
        int s = m.size();
        if (s > 0) {
            if (table == null) { // pre-size
                float ft = ((float)s / loadFactor) + 1.0F;
                int t = ((ft < (float)MAXIMUM_CAPACITY) ?
                         (int)ft : MAXIMUM_CAPACITY);
                if (t > threshold)
                    threshold = tableSizeFor(t);
            }
            else if (s > threshold)
                resize();
            for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
                K key = e.getKey();
                V value = e.getValue();
                putVal(hash(key), key, value, false, evict);
            }
        }
    }

那回到上面的问题,我们通过expectedCapacity / 0.75F + 1.0F计算,15 / 0.75 + 1 = 21 ,21经过JDK处理之后,会被设置成32,这就大大的减少了扩容的几率

当然,这样操作可以保证一定的性能,但是会牺牲内存。其实,负载因子的大小本身就是时间和空间上平衡的一个选择,这也是面试中经常会被问到的一个问题。

  • 如果内存空间很多而又对时间效率要求很高,可以降低负载因子loadFactor的值。
  • 相反,如果内存空间紧张而又对时间效率要求不高,可以增加负载因子loadFactor的值。

当然,有小伙伴可能会问,我该怎么获取HashMap的容量capacity以及阈值threshold呢?

利用反射的机制,获取HashMap的非public方法capacity()和非public属性threshold。

下面附上代码:

public static void main(String[] args) throws Exception {
    //指定初始容量15来创建一个HashMap
    HashMap m = new HashMap(15);
    //获取HashMap整个类
    Class<?> mapType = m.getClass();
    //获取指定属性,也可以调用getDeclaredFields()方法获取属性数组
    Field threshold =  mapType.getDeclaredField("threshold");
    //将目标属性设置为可以访问
    threshold.setAccessible(true);
    //获取指定方法,因为HashMap没有容量这个属性,但是capacity方法会返回容量值
    Method capacity = mapType.getDeclaredMethod("capacity");
    //设置目标方法为可访问
    capacity.setAccessible(true);
    //打印刚初始化的HashMap的容量、阈值
    System.out.println("容量:"+capacity.invoke(m) + "     阈值:"+threshold.get(m));
}

参考文章:HashMap容量及阈值获取

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值