Java集合HashMap初始容量与容量大小

Java集合HashMap初始容量与容量大小

这是两个问题

  • 为什么设置初始容量
  • 初始容量多大合适

第一个问题:为什么设置初始容量
这个答案其实通过阅读源码也可以得到。简单来说就是避免扩容带来的效率问题。扩容机制具体详见源码。
在初始化 HashMap 的时候,应该尽量指定其大小。尤其是当你已知 map 中存放的元素个数时。(《阿里巴巴 Java 开发规约》)

第二个问题:初始容量多大合适
那么,既然建议我们集合初始化的时候,要指定初始值大小,那么我们创建
HashMap 的时候,到底指定多少合适呢?

有些人会自然想到,我准备塞多少个元素我就设置成多少呗。比如我准备塞 7 个元素,那就 new HashMap(7)。但是,这么做不仅不对,而且以上方式创建出来的 Map 的容量也不是 7。因 为, 当 我 们 使 用 HashMap(int initialCapacity) 来 初 始 化 容 量 的 时 候,HashMap 并不会使用我们传进来的 initialCapacity 直接作为初识容量。JDK 会默认帮我们计算一个相对合理的值当做初始容量。所谓合理值,其实是找到第一个比用户传入的值大的 2 的幂。也就是说,当我们 new HashMap(7) 创建 HashMap 的时候,JDK 会通过计算,帮我们创建一个容量为 8 的 Map;当我们 new HashMap(9) 创建 HashMap 的时候,JDK 会通过计算,帮我们创建一个容量为 16 的 Map。但是,这个值看似合理,实际上并不尽然。因为 HashMap 在根据用户传入的capacity 计算得到的默认容量,并没有考虑到 loadFactor 这个因素,只是简单机械的计算出第一个大约这个数字的 2 的幂。

loadFactor 是负载因子,当 HashMap 中的元素个数(size)超过 threshold
= loadFactor * capacity 时,就会进行扩容。也就是说,如果我们设置的默认值是 7,经过 JDK 处理之后,HashMap 的容量会被设置成 8,但是,这个 HashMap 在元素个数达到 8*0.75 = 6 的时候就会进行一次扩容,这明显是我们不希望见到的。

那么,到底设置成什么值比较合理呢?
这里我们可以参考 JDK8 中 putAll 方法中的实现的,这个实现在 guava(21.0版本)也被采用。这个值的计算方法就是:

return (int) ((float) expectedSize / 0.75F + 1.0F);

比如我们计划向 HashMap 中放入 7 个元素的时候,我们通过 expectedSize /0.75F + 1.0F 计算,7/0.75 + 1 = 10 ,10 经过 JDK 处理之后,会被设置成 16,这就大大的减少了扩容的几率。
当 HashMap 内 部 维 护 的 哈 希 表 的 容 量 达 到 75% 时(默 认 情 况 下), 会 触发 rehash, 而 rehash 的 过 程 是 比 较 耗 费 时 间 的。 所 以 初 始 化 容 量 要 设 置 成expectedSize/0.75 + 1 的话,可以有效的减少冲突也可以减小误差。所以,我们可以认为,当我们明确知道 HashMap 中元素的个数的时候,把默认容量设置成 expectedSize / 0.75F + 1.0F 是一个在性能上相对好的选择,但是,同时也会牺牲些内存。

这个算法在 guava 中有实现,开发的时候,可以直接通过 Maps 类创建一个HashMap:
Map<String, String> map = Maps.newHashMapWithExpectedSize(7);

其代码实现如下:36  > Java 开发手册建议创建 HashMap 时设置初始化容量,但是多少合适呢?
public static <K, V> HashMap<K, V> newHashMapWithExpectedSize(int expectedSize) {
return new HashMap(capacity(expectedSize));
}
static int capacity(int expectedSize) {
if (expectedSize < 3) {
CollectPreconditions.checkNonnegative(expectedSize, “expectedSize”);
return expectedSize + 1;
} else {
return expectedSize < 1073741824 ? (int)((float)expectedSize/0.75F+1.0F) : 2147483647;
}
}

但是, 以上的操作是一种用内存换性能的做法,真正使用的时候,要考虑到内存的影响。但是,大多数情况下,我们还是认为内存是一种比较富裕的资源。但是话又说回来了,有些时候,我们到底要不要设置 HashMap 的初识值,这个值又设置成多少,真的有那么大影响吗?其实也不见得!可是,大的性能优化,不就是一个一个的优化细节堆叠出来的吗?再 不 济, 以 后 你 写 代 码 的 时 候, 使 用 Maps.newHashMapWithExpectedSize(7); 的写法,也可以让同事和老板眼前一亮。或者哪一天你碰到一个面试官问你一些细节的时候,你也能有个印象,或者某一天你也可以拿这个出去面试问其他人 ~ !啊哈哈哈

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值