Java容器与Hash算法的研究

这篇博客中我们以HashMap为例研究了容器类初始化和自动扩容时对内存的占用,通过阅读源代码我们发现
1. 初始容量为16
2. 扩容时会翻倍
另外在代码中我们还发现这样一条注释:

 /**
     * The default initial capacity - **MUST be a power of two.**
     */
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

结合着两条规律我们不难发现在绝大多数状况下,HashMap的容量都可以保证是2的n次幂,这样做有什么意义呢?我们还要从hashmap的原理说起。
上学学数据结构时候我们都知道散列表的原理是将元素的值与位置联系起来,通过值直接能够计算出位置,从而实现高效的随机访问,常见的算法就是进行模运算,value mod length。然而相对于位运算而言模运算是一个开销比较大的运算,Java中为了寻求更高效的实现是这样进行模运算的:

(table.length - 1) & hash

那么解决了性能问题,还有另外一个问题需要重视,算法应尽可能的把元素平均地分布在数组内,减少发生碰撞的概率,最理想的情况就是我们有一个无限长的数组,这样元素就可以直接把值当成位置的下标。当然现实中容器数组长度总有限制,但是基本思想是一样的,就是尽可能拿原始的元素值去找位置,那么怎样在与运算中保持输出尽可能地只受一个输入影响呢?就是让另外一个全为1,这样与出来的结果不会出现与原值符号相反的情况。也就是让length - 1等于一个各bit全是1的数字,那么length就一定是一个2的n次幂。反之如果length - 1的某一位是0,那么无论对应位置上hash值里是0还是1,运算结果都是0,相当于进行了归一化,这样做增大了发生碰撞的概率,也浪费了一定的内存空间。

那么我们在初始化hashmap时候应该申请多大的空间好呢?如果我们输入了一个不是2的n次幂的capacity是不是性能就会一直受影响呢?其实这个问题不用我们操心,构造函数并不会傻乎乎地按照我们输入的值去初始化,它偷偷做了一些工作:

    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
        this.threshold = tableSizeFor(initialCapacity);
    }

首先它并没有直接在构造函数里面就为数组申请空间,而是lazy到第一次往里面put数据的时候,在构造函数里只是设置了下threshold,刚才说的偷偷做了一些工作就在tableSizeFor这里:

/**
     * Returns a power of two size for the given target capacity.
     */
    static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }

这段代码最终的作用就是输出不小于cap的第一个2的n次幂,作为threshold。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值