HashMap总结

最新推荐文章于 2022-04-23 14:13:00 发布

weixin_45154349

最新推荐文章于 2022-04-23 14:13:00 发布

阅读量67

点赞数

文章标签： java 算法链表数据结构

本文链接：https://blog.csdn.net/weixin_45154349/article/details/112677453

版权

本文详细解析了HashMap在JDK1.8前后底层数据结构的变化，重点介绍了1.8中动态扩容机制和为何选择0.75作为加载因子。还探讨了长度为2的n次方的原因，以及为什么节点转红黑树选择8个元素。涉及核心知识点有哈希算法、碰撞处理和性能调优。

摘要由CSDN通过智能技术生成

1.hashmap的底层数据结构 1.8之前和1.8的区别?
JDK1.8 之前 HashMap 底层是数组和链表结合在一起使用也就是链表散列。HashMap 通过 key 的 hashCode 经过扰动函数处理过后得到 hash 值，然后通过 (n - 1) & hash 判断当前元素存放的位置（这里的 n 指的是数组的长度），如果当前位置存在元素的话，就判断该元素与要存入的元素的 hash 值以及 key 是否相同，如果相同的话，直接覆盖，不相同就通过拉链法解决冲突。

所谓扰动函数指的就是 HashMap 的 hash 方法。使用 hash 方法也就是扰动函数是为了防止一些实现比较差的 hashCode()
方法换句话说使用扰动函数之后可以减少碰撞所谓 “拉链法”
就是：将链表和数组相结合。也就是说创建一个链表数组，数组中每一格就是一个链表。若遇到哈希冲突，则将冲突的值加到链表中即可

2.hashmap存储元素的过程

public static void main(String[] args) {
    Map<String,Integer> map = new HashMap<>();
    map.put("柳岩",22);
    map.put("柏芝",32);
    map.put("王菲",42);
    map.put("柳岩",29);
}

当创建HashMap集合对象的时候，在jdk8前，构造方法中创建一个一个长度是16的Entry[] table 用来存储键值对数据的。在jdk8以后不是在HashMap的构造方法底层创建数组了，是在第一次调用put方法时创建的数组，Node[]
table 来存储键值对数据的。
假设向哈希表中存储”柳岩”,根据”柳岩”调用String类中重写之后的hashCode()方法计算出值，然后结合数组长度采用某种算法计算出向Node数组中存储数据的空间的索引值。如果计算出的索引空间没有数据则直接将”柳岩”存储到数组中。
举例：计算出的索引是3

3.hashMap 加载因子为什么0.75

提高空间利用率和减少查询成本的折中，主要是泊松分布，0.75的话碰撞最小，
HashMap有两个参数影响其性能：初始容量和加载因子。容量是哈希表中桶的数量，初始容量只是哈希表在创建时的容量。加载因子是哈希表在其容量自动扩容之前可以达到多满的一种度量。当哈希表中的条目数超出了加载因子与当前容量的乘积时，则要对该哈希表进行扩容、rehash操作（即重建内部数据结构），扩容后的哈希表将具有两倍的原容量。
通常，加载因子需要在时间和空间成本上寻求一种折衷。
加载因子过高，例如为1，虽然减少了空间开销，提高了空间利用率，但同时也增加了查询时间成本；
加载因子过低，例如0.5，虽然可以减少查询时间成本，但是空间利用率很低，同时提高了rehash操作的次数。
在设置初始容量时应该考虑到映射中所需的条目数及其加载因子，以便最大限度地减少rehash操作次数，所以，一般在使用HashMap时建议根据预估值设置初始容量，减少扩容操作。
选择0.75作为默认的加载因子，完全是时间和空间成本上寻求的一种折衷选择

4.hashmap 为什么长度是2的n次方
HashMap存取时，都需要计算当前key应该对应Entry[]数组哪个元素，即计算数组下标；算法如下：

   /**

     * Returns index for hash code h.

     */

    static int indexFor(int h, int length) {
        return h & (length-1);

    }

HashMap为了存取高效，要尽量较少碰撞，就是要尽量把数据分配均匀，每个链表长度大致相同，这个实现就在把数据存到哪个链表中的算法；
这个算法实际就是取模，hash%length，计算机中直接求余效率不如位移运算，源码中做了优化hash&(length-1)，
hash%length==hash&(length-1)的前提是length是2的n次方；
为什么这样能均匀分布减少碰撞呢？2的n次方实际就是1后面n个0，2的n次方-1 实际就是n个1；
例如长度为9时候，3&(9-1)=0 2&(9-1)=0 ，都在0上，碰撞了；
例如长度为8时候，3&(8-1)=3 2&(8-1)=2 ，不同位置上，不碰撞

5.为什么转换成红黑树的节点是8