HashMap底层原理深剖

1、基本结构(哈希表--数组+红黑树) 

•基于哈希表的Map接口的实现。此实现提供所有可选的映射操作,并允许 空值和空键。(HashMap 类与Hashtable大致等效,不同之处在于它是不同步的,并且允许为null。)此类不保证映射的顺序。特别是,它不能保证顺序会随着时间的推移保持恒定。
开放定址法 : Hi = (H(key) + di) MOD m,其中i=1,2,…,k(k<=m-1) H(key)为哈希函数,m为哈希表表长,di为增量序列。
链地址法:将冲突位置的元素构造成链表。在添加数据的时候,如果哈希地址与哈希表上的元素冲突,就放在这个位置的链表上。
•HashMap的底层是 哈希表 ,是存储键值对的结构类型,其采用是数组+链表/红黑树的组合来作为底层结构,也就是开放地址法+链地址法的方式来实现HashMap。

•HashMap的实例具有两个影响其性能的参数:初始容量(0.75f)和负载因子(load factor)。容量是哈希表中存储桶的数量,初始容量只是创建哈希表时的容量。负载因子是在自动增加其哈希表容量之前允许哈希表获得的满度的度量。从代码中我们可以看到,在向 HashMap 中添加元素过程中,如果 元素个数(size)超过临界值(threshold) 的时候,就会进行自动扩容(resize),并且,在扩容之后,还需要对 HashMap 中原有元素进行 rehash,即将原来桶中的元素重新分配到新的桶中。在 HashMap 中,临界值(threshold) = 负载因子(loadFactor) * 容量(capacity)。LoadFactor 是装载因子,表示 HashMap 满的程度 哈希表中存入的数据元素个数与哈希地址空间的大小的比值默认值为 0.75f,也就是说默认情况下,当 HashMap 中元素个数达到了容量的 3/4 的时候就会进行自动扩容。 

                  

2、hashMap 的影响因子是0.75的原因(符合二项分布)

•我们可以设想,实验的Hash值是随机的,并且他们经过Hash运算都会映射到Hash表的长度的地址空间上,那么这个结果也是随机的。所以,每次put的时候就相当于我们在扔一个s面(我们先假设默认长度为16)的骰子,扔骰子实验那肯定是相互独立的。碰撞发生即扔了n次有出现重复数字。

就是掷了n次骰子,没有一次是相同的概率,需要尽可能的大些,一般意义上我们肯定要大于0.5。于是,n次事件里面,碰撞为0的概率,s 表示HashMap 的 容量大小即Bucket数组长度,由上面公式得

 我们希望n次实验以后 上面式子概率大于0.5。这时候,我们对于该公式其实最想求的时候长度s的时候,n为多少次就应该进行扩容了?而负载因子则是n/s的值。所以推导如下:

•对不等式右边取极限,然后转化为求极限问题可得:

 

 •即Load Factor 极限值应该在0.693,但是Java Hash Map扩容保证capacity 的值永远都是 2 的幂,所以为了保证负载因子(loadFactor) * 容量(capacity)的结果是一个整数,这个值是 0.75(3/4) 比较合理,因为这个数和任何 2 的幂乘积结果都是整数,不同的语言的实现略有不同(C#的LoadFactor是0.72,python 的是0.8) ,一般这个值分布在0.6-0.9 之间。

 3、为什么链表长度达到8的时候转成红黑树

当链表长度大于或等于阈值(默认为 8)的时候,如果同时还满足容量大于或等于 MIN_TREEIFY_CAPACITY(默认为 64)的要求,就会把链表转换为红黑树。同样,后续如果由于删除或者其他原因调整了大小,当红黑树的节点小于或等于 6 个以后,又会恢复为链表形态。
•理想状态下,在随机哈希值的情况,对于loadfactor = 0.75 ,桶中的Node的分布频率服从参数为0.5的泊松分布, 得到链表长度为8 起发生的概率为0.00000006。

4、进一步思考 

•明白Hash Map碰撞概率服从二项分布模型,甚至在理想状态可以用泊松分布替代计算,有何实际应用?
 应用:一般不改localfactor(影响因子)

•当发现HashMap 在内存里不停的扩容时候,怎么可以定量定性为本身Hash的方法实现不满足现在需求,从而造成碰撞频繁而扩容?
 
定量定性:监控工具、卡方检验(统计样本的实际观测值与理论推断值之间的偏离程度)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值