HashMap深度解释推导

JavaMa-

已于 2022-02-24 10:39:02 修改

阅读量4.3k

点赞数 12

分类专栏：算法文章标签： hashmap java

于 2020-11-19 13:40:43 首次发布

本文链接：https://blog.csdn.net/weixin_43883685/article/details/109809049

版权

算法专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1. 泊松分布公式：

在这里插入图片描述

2. HashMap泊松分布的解释推导：

    
     * Ideally, under random hashCodes, the frequency of
     * nodes in bins follows a Poisson distribution
     * (http://en.wikipedia.org/wiki/Poisson_distribution) with a
     * parameter of about 0.5 on average for the default resizing
     * threshold of 0.75, although with a large variance because of
     * resizing granularity.
     *
     * 翻译：
     *     尽管因为调整粒度而产生较大的方差，但是理想的情况，在随机hashCodes下，桶中节	点的频率遵循泊松分布。
     *     默认调整阈值为0.75的条件下，泊松分布中的概率参数λ=0.5。
     * 解释：
     * 	   k表示数量，这里指桶中节点的个数。
     *     λ表示事件的频率。这里λ=0.5，代表理想情况下，平均100个桶，50个数据，则1个桶有数据的概率是0.5。
     *     忽略方差，把λ代入。则求一个桶中出现k个节点的概率，公式为：
     
     
    private static String poisson(int k) {
        //泊松分布 Java
        double value = Math.exp(-0.5) * Math.pow(0.5, k) / IntMath.factorial(k);
        //格式化参数，保留10位小数。
        return new BigDecimal(value+"").setScale(10, ROUND_HALF_UP).toPlainString();
    }

这里抛出一个问题，为什么默认扩容因子是0.75? （答案见下文）

3. 打印结果：

    public static void main(String[] args) {
        System.out.println("1个桶中出现1个节点的概率:" + poisson(1));
        System.out.println("1个桶中出现2个节点的概率:" +poisson(2));
        System.out.println("1个桶中出现3个节点的概率:" +poisson(3));
        System.out.println("1个桶中出现4个节点的概率:" +poisson(4));
        System.out.println("1个桶中出现5个节点的概率:" +poisson(5));
        System.out.println("1个桶中出现6个节点的概率:" +poisson(6));
        System.out.println("1个桶中出现7个节点的概率:" +poisson(7));
        System.out.println("1个桶中出现8个节点的概率:" +poisson(8));//亿分之六
        System.out.println("1个桶中出现9个节点的概率:" +poisson(9));
    }

Console:
	1个桶中出现1个节点的概率:0.3032653299
	1个桶中出现2个节点的概率:0.0758163325
	1个桶中出现3个节点的概率:0.0126360554
	1个桶中出现4个节点的概率:0.0015795069
	1个桶中出现5个节点的概率:0.0001579507
	1个桶中出现6个节点的概率:0.0000131626
	1个桶中出现7个节点的概率:0.0000009402
	1个桶中出现8个节点的概率:0.0000000588//亿分之六
	1个桶中出现9个节点的概率:0.0000000033

4. 解释树化的两个条件：

为什么链表长度达到8？
因为达到8个元素的时候，概率已经很低了。此时树化，性价比会很高。
既不会因为链表太长(8)导致复杂度加大，也不会因为概率太高导致太多节点树化。
为什么数组长度达到64？

/**
* The smallest table capacity for which bins may be treeified.
* (Otherwise the table is resized if too many nodes in a bin.)
* Should be at least 4 * TREEIFY_THRESHOLD to avoid conflicts
* between resizing and treeification thresholds.
*/
翻译：应该至少为4 * TREEIFY_THRESHOLD = 32，以避免大小调整和树化阈值之间发生冲突。

5. 为什么λ=0.5？

应该是这样计算的：
假设n是HashMap的数组长度，扩容因子是0.75
则扩容前一刻桶中有数据的概率+扩容后一刻桶中有数据的概率，求平均值即代表一个桶中有数据的平均概率是0.5。对应图中的公式：
（备注：强行推导，没有任何依据，只是凭感觉，勿喷。）
在这里插入图片描述

6. 为什么默认扩容因子是0.75?

注释里给出了原因：
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210119161014359.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80Mzg4MzY4NQ==,size_16,color_FFFFFF,t_70

翻译：一般来说，默认的加载系数(0.75)提供了一个很好的选择时间和空间成本的权衡。较高的数值会降低空间开销，但增加查找成本(反映在大多数 HashMap类的操作，包括get and put)…

6. 总结：

时间和空间成本的权衡 ==> 决定了扩容因子是0.75 ==> 决定了泊松分布的参数λ是0.5 ==> 计算出泊松分布结果为8时，概率为亿分之六 ==> 决定了树化节点为8.

JavaMa-

关注

12
点赞
踩
32

收藏

觉得还不错? 一键收藏
10
评论
HashMap深度解释推导

1. HashMap泊松分布的解释推导： /** * Ideally, under random hashCodes, the frequency of * nodes in bins follows a Poisson distribution * (http://en.wikipedia.org/wiki/Poisson_distribution) with a * parameter of about 0.5 on average for the def
复制链接

扫一扫

专栏目录