HashMap的初始容量为16,扩容为何是2的次幂

东方贵族

已于 2022-03-16 13:56:41 修改

阅读量1k

点赞数

分类专栏： Android面试文章标签：哈希算法 java 散列表

于 2022-03-16 13:55:20 首次发布

本文链接：https://blog.csdn.net/qq_35872440/article/details/123524300

版权

Android面试专栏收录该内容

5 篇文章 0 订阅

订阅专栏

[添加链接描述]原文来源

HashMap的hash的作用

首先要了解HashMap的hash实现过程，hash方法的功能是根据key来定位K-V在链表数组中的位置的，也就是hash方法的输入应该是个Object类型的key（注意：如果key传入的是基本数据类型会被转换为其包装类），输出应该是个int类型的数组下标。

常规思路是通过key的hashCode对HashMap的容量进行取模就可以了，但是考虑到效率的问题HashMap的hash方法实现还是有一定复杂的。

hash的实现

具体实现上由两个方法int hash(Object) 和 int indexFor(int h, int length)来实现。

hash：该方法主要是将Object转为一个整型
indexFor：该方法主要是将hash生成的整型转换为链表数组中的下标

为了聚焦本文的重点，我们来看一下indexFor方法。我们先来看下Java7中该实现细节（Java 8查询下标的方法原理是一样的）：

static int indexFor(int h, int length) {
return h & (length - 1);
}

indexFor方法其实主要是将hashcode换成链表数组中的下标。其中的两个参数h表示元素的hashcode值，length表示HashMap的容量。那么return h & (length-1) 是什么意思呢？

其实，他就是取模。Java之所有使用位运算(&)来代替取模运算(%)，最主要的考虑就是效率。位运算(&)效率要比代替取模运算(%)高很多，主要原因是位运算直接对内存数据进行操作，不需要转成十进制，因此处理速度非常快。

那么，为什么可以用位运算（&）来实现取模运算（%）呢？这实现的原理如下：

X % 2^n = X & (2^n - 1)

假设n为3，则2^3 = 8，表示成2进制就是1000。
此时X & (2^3 – 1) 就相当于取X的2进制的最后三位数。
从2进制角度来看，X / 8相当于 X >> 3，即把X右移3位，此时得到了X / 8的商，而被移掉的部分(后三位)，则是X % 8，也就是余数。
上面的解释不知道你有没有看懂，没看懂的话其实也没关系，你只需要记住这个技巧就可以了。

所以，return h & (length-1);只要保证length的长度是2^n 的话，就可以实现取模运算了。
所以，因为位运算直接对内存数据进行操作，不需要转成十进制，所以位运算要比取模运算的效率更高，所以HashMap在计算元素要存放在数组中的index的时候，使用位运算代替了取模运算。之所以可以做等价代替，前提是要求HashMap的容量一定要是2^n 。

那么，既然是2^n ，为啥一定要是16呢？为什么不能是4、8或者32呢？

关于这个默认容量的选择，JDK并没有给出官方解释，笔者也没有在网上找到关于这个任何有价值的资料。（如果哪位有相关的权威资料或者想法，可以留言交流）

根据作者的推断，这应该就是个经验值（Experience Value），既然一定要设置一个默认的2^n 作为初始值，那么就需要在效率和内存使用上做一个权衡。这个值既不能太小，也不能太大。

太小了就有可能频繁发生扩容，影响效率。太大了又浪费空间，不划算。

所以，16就作为一个经验值被采用了。

在JDK 8中，关于默认容量的定义为：static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16 ，其故意把16写成1<<4，就是提醒开发者，这个地方要是2的幂。值得玩味的是：注释中的 aka 16 也是1.8中新增的，

那么，接下来我们再来谈谈，HashMap是如何保证其容量一定可以是2^n 的呢？如果用户自己设置了的话又会怎么样呢？

关于这部分，HashMap在两个可能改变其容量的地方都做了兼容处理，分别是指定容量初始化时以及扩容时。

指定容量初始化
当我们通过HashMap(int initialCapacity)设置初始容量的时候，HashMap并不一定会直接采用我们传入的数值，而是经过计算，得到一个新值，目的是提高hash的效率。(1->1、3->4、7->8、9->16)

在JDK 1.7和JDK 1.8中，HashMap初始化这个容量的时机不同。JDK 1.8中，在调用HashMap的构造函数定义HashMap的时候，就会进行容量的设定。而在JDK 1.7中，要等到第一次put操作时才进行这一操作。

看一下JDK是如何找到比传入的指定值大的第一个2的幂的：

int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;

东方贵族

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HashMap的初始容量为16,扩容为何是2的次幂

HashMap的hash的作用首先要了解HashMap的hash实现过程，hash方法的功能是根据key来定位K-V在链表数组中的位置的，也就是hash方法的输入应该是个Object类型的key（注意：如果key传入的是基本数据类型会被转换为其包装类），输出应该是个int类型的数组下标。常规思路是通过key的hashCode对HashMap的容量进行取模就可以了，但是考虑到效率的问题HashMap的hash方法实现还是有一定复杂的。hash的实现具体实现上由两个方法int hash(Object)
复制链接

扫一扫