HashMap深度解释推导

1. 泊松分布公式:

在这里插入图片描述

2. HashMap泊松分布的解释推导:
    
     * Ideally, under random hashCodes, the frequency of
     * nodes in bins follows a Poisson distribution
     * (http://en.wikipedia.org/wiki/Poisson_distribution) with a
     * parameter of about 0.5 on average for the default resizing
     * threshold of 0.75, although with a large variance because of
     * resizing granularity.
     *
     * 翻译:
     *     尽管因为调整粒度而产生较大的方差,但是理想的情况,在随机hashCodes下,桶中节	点的频率遵循泊松分布。
     *     默认调整阈值为0.75的条件下,泊松分布中的概率参数λ=0.5* 解释:
     * 	   k表示数量,这里指桶中节点的个数。
     *     λ表示事件的频率。这里λ=0.5,代表理想情况下,平均100个桶,50个数据,则1个桶有数据的概率是0.5*     忽略方差,把λ代入。则求一个桶中出现k个节点的概率,公式为:
     
     
    private static String poisson(int k) {
        //泊松分布 Java
        double value = Math.exp(-0.5) * Math.pow(0.5, k) / IntMath.factorial(k);
        //格式化参数,保留10位小数。
        return new BigDecimal(value+"").setScale(10, ROUND_HALF_UP).toPlainString();
    }
    

这里抛出一个问题,为什么默认扩容因子是0.75? ( 答案见下文)

3. 打印结果:
    public static void main(String[] args) {
        System.out.println("1个桶中出现1个节点的概率:" + poisson(1));
        System.out.println("1个桶中出现2个节点的概率:" +poisson(2));
        System.out.println("1个桶中出现3个节点的概率:" +poisson(3));
        System.out.println("1个桶中出现4个节点的概率:" +poisson(4));
        System.out.println("1个桶中出现5个节点的概率:" +poisson(5));
        System.out.println("1个桶中出现6个节点的概率:" +poisson(6));
        System.out.println("1个桶中出现7个节点的概率:" +poisson(7));
        System.out.println("1个桶中出现8个节点的概率:" +poisson(8));//亿分之六
        System.out.println("1个桶中出现9个节点的概率:" +poisson(9));
    }

Console:
	1个桶中出现1个节点的概率:0.3032653299
	1个桶中出现2个节点的概率:0.0758163325
	1个桶中出现3个节点的概率:0.0126360554
	1个桶中出现4个节点的概率:0.0015795069
	1个桶中出现5个节点的概率:0.0001579507
	1个桶中出现6个节点的概率:0.0000131626
	1个桶中出现7个节点的概率:0.0000009402
	1个桶中出现8个节点的概率:0.0000000588//亿分之六
	1个桶中出现9个节点的概率:0.0000000033
4. 解释树化的两个条件:
  1. 为什么链表长度达到8?
    因为达到8个元素的时候,概率已经很低了。此时树化,性价比会很高。
    既不会因为链表太长(8)导致复杂度加大,也不会因为概率太高导致太多节点树化。
  2. 为什么数组长度达到64?

/**
* The smallest table capacity for which bins may be treeified.
* (Otherwise the table is resized if too many nodes in a bin.)
* Should be at least 4 * TREEIFY_THRESHOLD to avoid conflicts
* between resizing and treeification thresholds.
*/
翻译:应该至少为4 * TREEIFY_THRESHOLD = 32,以避免大小调整和树化阈值之间发生冲突。

5. 为什么λ=0.5?

应该是这样计算的:
假设n是HashMap的数组长度,扩容因子是0.75
则扩容前一刻桶中有数据的概率+扩容后一刻桶中有数据的概率,求平均值即代表一个桶中有数据的平均概率是0.5。对应图中的公式:
(备注:强行推导,没有任何依据,只是凭感觉,勿喷。)
在这里插入图片描述

6. 为什么默认扩容因子是0.75?

注释里给出了原因:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210119161014359.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80Mzg4MzY4NQ==,size_16,color_FFFFFF,t_70

翻译:一般来说,默认的加载系数(0.75)提供了一个很好的选择时间和空间成本的权衡。较高的数值会降低空间开销,但增加查找成本(反映在大多数 HashMap类的操作,包括get and put)…

6. 总结:

时间和空间成本的权衡 ==> 决定了扩容因子是0.75 ==> 决定了泊松分布的参数λ是0.5 ==> 计算出泊松分布结果为8时,概率为亿分之六 ==> 决定了树化节点为8.

  • 12
    点赞
  • 32
    收藏
    觉得还不错? 一键收藏
  • 10
    评论
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值