【HashMap】初始化时,尽量指定初始值大小

在这里插入图片描述

这是一个来自《阿里巴巴Java开发手册》IDEA插件的一个提示。

《阿里巴巴Java开发手册》IDEA插件使用,提升代码质量的利器,如何安装

HashMap创建的时候,要不要指定容量?

如果我们没有设置初始容量大小,随着元素的不断增加,HashMap会发生多次扩容,而HashMap中的扩容机制决定了每次扩容都需要重建hash表,是非常影响性能的。

HashMap有扩容机制,就是当达到扩容条件时会进行扩容。HashMap的扩容条件就是当HashMap中的元素个数(size)超过临界值(threshold)时就会自动扩容。在HashMap中,threshold = loadFactor * capacity。

HashMap 初始化容量设置多少合适?

错误的做法

有些人会自然想到,我准备塞多少个元素我就设置成多少呗。比如我准备塞7 个元素,那就new HashMap(7)。

错误的原因

当我们使用HashMap(int initialCapacity) 来初始化容量的时候, HashMap 并不会使用我们传进来的initialCapacity 直接作为初识容量。

JDK 会默认帮我们计算一个相对合理的值当做初始容量。所谓合理值,其实是找到第一个比用户传入的值大的2 的幂。

也就是说,当我们new HashMap(7) 创建HashMap 的时候,JDK 会通过计算,帮我们创建一个容量为8 的Map;当我们new HashMap(9) 创建HashMap 的时候,JDK 会通过计算,帮我们创建一个容量为16 的Map。

但是,这个值看似合理,实际上并不尽然。因为HashMap 在根据用户传入的capacity 计算得到的默认容量,并没有考虑到loadFactor 这个因素,只是简单机械的计算出第一个大约这个数字的2 的幂。

loadFactor 是负载因子,当HashMap 中的元素个数(size)超过 threshold = loadFactor * capacity 时,就会进行扩容。

也就是说,如果我们设置的默认值是7,经过JDK 处理之后,HashMap 的容量会被设置成8,但是,这个HashMap 在元素个数达到 8*0.75 = 6 的时候就会进行一次扩容,这明显是我们不希望见到的。

正确的做法

当我们明确知道HashMap 中元素的个数的时候,把默认容量设置成expectedSize / 0.75F + 1.0F 是一个在性能上相对好的选择,但是,同时也会牺牲些内存

我们可以参考JDK8 中putAll 方法中的实现的,这个实现在guava(21.0 版本)也被采用。

这个值的计算方法就是: return (int) ((float) expectedSize / 0.75F + 1.0F);

比如我们计划向HashMap 中放入7 个元素的时候,我们通过expectedSize / 0.75F + 1.0F 计算,7/0.75 + 1 = 10 ,10 经过JDK 处理之后,会被设置成16,这就大大的减少了扩容的几率。

当HashMap 内部维护的哈希表的容量达到75% 时(默认情况下), 会触发rehash, 而rehash 的过程是比较耗费时间的。所以初始化容量要设置成expectedSize/0.75 + 1 的话,可以有效的减少冲突也可以减小误差。

方便的方法

这个算法在guava 中有实现,开发的时候,可以直接通过Maps 类创建一个HashMap

 Map<String, String> map = Maps.newHashMapWithExpectedSize(7); 

其代码实现如下:

public static <K, V> HashMap<K, V> newHashMapWithExpectedSize(int expectedSize) { 
           return new HashMap(capacity(expectedSize)); 
}

static int capacity(int expectedSize) { 
       if (expectedSize < 3) { 
              CollectPreconditions.checkNonnegative(expectedSize, "expectedSize"); 
              return expectedSize + 1; 
       } else { 
            return expectedSize < 1073741824 ? (int)((float)expectedSize / 0.75F  + 1.0F) : 2147483647; 
       } 
} 

总结

但是,以上的操作是一种用内存换性能的做法,真正使用的时候,要考虑到内存的影响。但是,大多数情况下,我们还是认为内存是一种比较富裕的资源。

但是话又说回来了,有些时候,我们到底要不要设置HashMap 的初识值,这个值又设置成多少,真的有那么大影响吗?其实也不见得!

可是,大的性能优化,不就是一个一个的优化细节堆叠出来的吗?

再不济, 以后你写代码的时候, 使用Maps.newHashMapWithExpectedSize(7); 的写法,也可以让同事和老板眼前一亮。

  • 5
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值