HashMap的桶位为什么是2的N次方(源码分析----1.8)

内部类Node,实现Map.Entry(jdk1.8初次出现Node)

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable {
    static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        V value;
        Node<K,V> next;
    }
}

HashMap实体中常量部分

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable {
    /**
     * 初始化容量,必须是2的N次方
     * 
     * 1<<4即:1转换为二进制,向左移4位,右侧补零。00001(1) ----> 10000(16)
     */
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;

    /**
     * 最大容量为1左移30位,即1+30个0共31位,大约为int最大值的一半
     * int共32位,首位0位正数 1位负数,不参与运算。因此最大值为2^31-1:共31个1
     */
    static final int MAXIMUM_CAPACITY = 1 << 30;

    /**
     * 默认负载因子0.75
     */
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

    /**
     * 阈值,当拉链超过8,转换为红黑树
     */
    static final int TREEIFY_THRESHOLD = 8;

    /**
     * 扩容后,若某个红黑树长度<6,则转换回链表
     */
    static final int UNTREEIFY_THRESHOLD = 6;

    /**
     * 当map容量整体>64,才考虑转换红黑树
     */
    static final int MIN_TREEIFY_CAPACITY = 64;
}

构造方法

    /**
     * 可指定初始化长度及负载因子
     *
     * 长度必须在0到1 << 30之间,否则报错
     * 长度若合法,则根据tableSizeFor计算长度
     */
    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
        this.threshold = tableSizeFor(initialCapacity);
    }

    /**
     * 将一个给定初始值,返回接近2的N次方数值,例如:2->2,3->4,7->8等,若小于0直接返回0,大于最大值返回最大值
     * 
     * 进来一个数,-1后,不断的向右无符号移动后和自己按位取或,
     * 例如:3,-1=2(0010),右移1(0001),按位取或:0011 = 3
     *     3继续右移2(0000),| 0011 = 0011(3),因此到最后一句之前都是3
     *     最后一句3+1=4,最终返回4
     */
    static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }

    public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }

    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

    public HashMap(Map<? extends K, ? extends V> m) {
        this.loadFactor = DEFAULT_LOAD_FACTOR;
        putMapEntries(m, false);
    }

从tableSizeFor方法可以看出,不论入参初始化hashMap长度为多少,其内部均会将其转换为一个2的N次方数值,这是为什么呢?

HashMap寻址使用的除留余数法,即位置 = hash%size,而对于计算机来说,位运算速度会更快,于是在代码中将寻址算法优化成了hash&(size-1),例如下图get方法中根据hash值获取桶位计算index使用了tab[(n - 1) & hash],但优化的前提是:hash%size == hash&(size-1)时,size必须为2的N次方。

因为:size-1即2^n-1,数字为全1,但最高位为0;若hash比size大,则高位与变0,低位全1与不变,相当于做了模除运算。

例如:9%8=1;

 9(1001)& 7(0111) ---> 0001,即1

这样优化可以减少散列过程中的碰撞,使得元素更加均匀的分布。

  • 假设长度为9:3&(9-1)=0 , 2&(9-1)=0;均在0号桶位,产生碰撞
  • 假设长度为8:3&(8-1)=3,2&(8-1)=2;不同桶位,未产生碰撞

原因总结

  1. 优化取余算法至位运算,提高执行效率
  2. 提高执行效率的同时要像除留余数法一样均匀分布,减少碰撞
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值