JDK8中HashMap链表转红黑树的阈值为什么选8？为什么用红黑树做优化？

最新推荐文章于 2024-08-12 13:42:19 发布

王英豪很ok，

最新推荐文章于 2024-08-12 13:42:19 发布

阅读量8.7k

点赞数 20

分类专栏： JAVA HashMap 数据结构与算法文章标签： JDK8HashMap为什么引入红黑树做查询优化 HashMap的树化阀值为什么选8？

本文链接：https://blog.csdn.net/qq_43519310/article/details/102887039

版权

JAVA 同时被 3 个专栏收录

14 篇文章 1 订阅

订阅专栏

HashMap

3 篇文章 0 订阅

订阅专栏

数据结构与算法

2 篇文章 0 订阅

订阅专栏

为什么会引入红黑树做查询优化呢？

在平常我们用HashMap的时候，HashMap里面存储的key是具有良好的hash算法的key（比如String、Integer等包装类），冲突几率自然微乎其微，此时链表几乎不会转化为红黑树，但是当key为我们自定义的对象时，我们可能采用了不好的hash算法，使HashMap中key的冲突率极高，但是这时HashMap为了保证高速的查找效率，就引入了红黑树来优化查询了。

为什么树化的临界值为8？

通过源码我们得知HashMap源码作者通过泊松分布算出，当桶中结点个数为8时，出现的几率是亿分之6的，因此常见的情况是桶中个数小于8的情况，此时链表的查询性能和红黑树相差不多，因为转化为树还需要时间和空间，所以此时没有转化成树的必要。

既然个数为8时发生的几率这么低，我们为什么还要当链表个数大于8时来树化来优化这几乎不会发生的场景呢？

首先我们要知道亿分之6这个几乎不可能的概率是建立在什么情况下的答案是：建立在良好的hash算法情况下，例如String，Integer等包装类的hash算法、如果一旦发生桶中元素大于8，说明是不正常情况，可能采用了冲突较大的hash算法，此时桶中个数出现超过8的概率是非常大的，可能有n个key冲突在同一个桶中，此时再看链表的平均查询复杂度和红黑树的时间复杂度，就知道为什么要引入红黑树了，

举个例子，若hash算法写的不好，一个桶中冲突1024个key，使用链表平均需要查询512次，但是红黑树仅仅10次，红黑树的引入保证了在大量hash冲突的情况下，HashMap还具有良好的查询性能