Jdk1.8 HashMap中的几个问题帮你一网打尽:hashCode()、为何初始capacity16扩容为2的幂次、乘子31、tableSizeFor()方法何解?

1.HashMap几个问题的提出

看过jdk8源码的小火把肯定在第一次看完后就会有疑问,主要疑问在一下几个问题:

2.为什么要用有hashCode()?

不管是在存数据,还是在取数据的时候,均会下调用hash(Object key)这个方法,hash(Object key)源码如下:

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

2.1 存的时候

获得hash之后,简单的位运算后就可以直接在数组中定位所在下标的位置。直接定位数组的index存入效率O(1),(当然如果有hash冲突的情况,如果有hash冲突,同样是最快的,只需要另外调用equals()方法做后续比较即可):

if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);

2.2 取的时候

在取的时候,同样直接定位到数组index的位置获取元素,效率O(1),(当然如果有hash冲突的情况,如果有hash冲突,同样是最快的,只需要另外调用equals()方法做后续比较即可):

(first = tab[(n - 1) & hash]) != null) {

2.3 hashCode()总结

从存取两侧层面可以看使用hashCode()的方式是最快的。没有之一,如果使用遍历数组的方式去查找,黄花菜都凉了,O(n)了大哥。

3.为什么初始容量为16?或者说为什么在构造器中给了一个初始容量大小,它还是会把他修改为大于等于次数的最小2的n次幂的形式?

  • 关于容量在哪里用到了?取的时候都会用到,即存取均用到了这行代码:
tab[i = (n - 1) & hash]

上面提到在获取hash之后会做一个简单的位运算。我们分析一下这个为运算:

i = (n - 1) & hash

先给出结论:

  1. 为了不让下标越界
  2. 为了hash分布的更均匀

3.1 为了不让下标越界

当capacity = n 为2的幂次的时候,n-1的二进制应该是这种情况,下面看一下二进制的情况:
n= 1000… //以1开头,后面为n个0的情况。
那么n-1= 0111…//以0开头,后面均为1的情况
如:

十进制n二进制n-1二进制
21001
4100011
810000111
161000001111
32100000011111
6410000000111111
1281000000001111111
256100000000011111111

(n - 1) & hash :&意为且。均为1则为1,这样就保证这个&运算的结果,永远不可能大于(n - 1)的值,即永远不会大于等于capacity 。最大索引为capacity -1。

3.2 为了hash分布的更均匀

&:对应为之均为1结果才为1.
i = (n - 1) & hash的值,即i的值,怎么保证Node在table中是均匀存放的呢?
反例证明:如果n的值不是2的n次幂的形式,n-1就会出现二进制末尾为0的情况,即:n-1 = ***0(前面n为可以为0或者1),这回造成一个生命现象呢?
索引永远不会落在二进制下边为1结尾的索引上。会有一半的索引为空闲状态,进而会使结尾为0(二进制)的索引上发生hash冲突的概率为原来的2倍。会造成插入和查询的效率损失。
在这里插入图片描述

4.tableSizeFor()方法解析

源码:

    /**
     * Returns a power of two size for the given target capacity.
     */
    static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }

先说结论:就是大于等于cap的最小2的n次幂:

cap返回值
12
58
1016
2232
5064
  • 先说下为什么要cap - 1:
int n = cap - 1;

让cap-1再赋值给n的目的是另找到的目标值大于或等于原值。例如二进制1000,十进制数值为8。如果不对它减1而直接操作,将得到答案10000,即16。显然不是结果。减1后二进制为111,再进行操作则会得到原来的数值1000,即8。
再分析重头戏,下面的这几行代码:

n |= n >>> 1; 表示:n = (n |  n >>> 1)
|或:对应为只要有1几位1
  • 分析开始:
    假设
  1. n的二进制为:01xxxxxxxxxxxxxx…
  2. 右移一位: 001xxxxxxxxxxxxxx…
  3. 与n求或n的值:011xxxxxxxxxxxxxx…
  4. 同理, n |= n >>> 2;行执行完后n = 01111xxxxxxxxxxxxxxxxxxxxxxxxxxxx
  5. 同理, n |= n >>> 4;行执行完后n = 011111111xxxxxxxxxxxxxxxxxxxxxxxx
  6. 同理, n |= n >>> 8;行执行完后n = 01111111111111111xxxxxxxxxxxxxxxx
  7. 同理, n |= n >>> 16;行执行完后n = 011111111111111111111111111111111
  8. 到这里是不是熟悉了,return的时候最后在加1,正好又回到了100000…,前面一个1后面全是0的状态,即此方法返回的就是2的n次幂。

4 乘子31的问题解释

一句话为了让hash的分布更为均匀,他是素数
源码:

public int hashCode() {
        int h = hash;
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }

具体为什么要选择31呢?请参考:【jvm】科普:为什么 String hashCode 方法选择数字31作为乘子https://blog.csdn.net/happydecai/article/details/80493237

到此分享完毕,有不正确的请多多指正。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值