HashMap总结

本文详细解析了HashMap在JDK1.8前后底层数据结构的变化,重点介绍了1.8中动态扩容机制和为何选择0.75作为加载因子。还探讨了长度为2的n次方的原因,以及为什么节点转红黑树选择8个元素。涉及核心知识点有哈希算法、碰撞处理和性能调优。
摘要由CSDN通过智能技术生成

1.hashmap的底层数据结构 1.8之前和1.8的区别?
JDK1.8 之前 HashMap 底层是 数组和链表 结合在一起使用也就是 链表散列。HashMap 通过 key 的 hashCode 经过扰动函数处理过后得到 hash 值,然后通过 (n - 1) & hash 判断当前元素存放的位置(这里的 n 指的是数组的长度),如果当前位置存在元素的话,就判断该元素与要存入的元素的 hash 值以及 key 是否相同,如果相同的话,直接覆盖,不相同就通过拉链法解决冲突。

所谓扰动函数指的就是 HashMap 的 hash 方法。使用 hash 方法也就是扰动函数是为了防止一些实现比较差的 hashCode()
方法 换句话说使用扰动函数之后可以减少碰撞 所谓 “拉链法”
就是:将链表和数组相结合。也就是说创建一个链表数组,数组中每一格就是一个链表。若遇到哈希 冲突,则将冲突的值加到链表中即可
在这里插入图片描述

2.hashmap存储元素的过程

public static void main(String[] args) {
    Map<String,Integer> map = new HashMap<>();
    map.put("柳岩",22);
    map.put("柏芝",32);
    map.put("王菲",42);
    map.put("柳岩",29);
}

  1. 当创建HashMap集合对象的时候,在jdk8前,构造方法中创建一个一个长度是16的Entry[] table 用来存储键值对数据的。 在jdk8以后不是在HashMap的构造方法底层创建数组了,是在第一次调用put方法时创建的数组,Node[]
    table 来存储键值对数据的。
  2. 假设向哈希表中存储”柳岩”,根据”柳岩”调用String类中重写之后的hashCode()方法计算出值,然后结合数组长度采用某种算法计算出向Node数组中存储数据的空间的索引值。如果计算出的索引空间没有数据则直接将”柳岩”存储到数组中。
    举例:计算出的索引是3

3.hashMap 加载因子为什么0.75

提高空间利用率和 减少查询成本的折中,主要是泊松分布,0.75的话碰撞最小,
HashMap有两个参数影响其性能:初始容量和加载因子。容量是哈希表中桶的数量,初始容量只是哈希表在创建时的容量。加载因子是哈希表在其容量自动扩容之前可以达到多满的一种度量。当哈希表中的条目数超出了加载因子与当前容量的乘积时,则要对该哈希表进行扩容、rehash操作(即重建内部数据结构),扩容后的哈希表将具有两倍的原容量。
通常,加载因子需要在时间和空间成本上寻求一种折衷。
加载因子过高,例如为1,虽然减少了空间开销,提高了空间利用率,但同时也增加了查询时间成本;
加载因子过低,例如0.5,虽然可以减少查询时间成本,但是空间利用率很低,同时提高了rehash操作的次数。
在设置初始容量时应该考虑到映射中所需的条目数及其加载因子,以便最大限度地减少rehash操作次数,所以,一般在使用HashMap时建议根据预估值设置初始容量,减少扩容操作。
选择0.75作为默认的加载因子,完全是时间和空间成本上寻求的一种折衷选择

4.hashmap 为什么长度是2的n次方
HashMap存取时,都需要计算当前key应该对应Entry[]数组哪个元素,即计算数组下标;算法如下:

   /**

     * Returns index for hash code h.

     */

    static int indexFor(int h, int length) {
        return h & (length-1);

    }

HashMap为了存取高效,要尽量较少碰撞,就是要尽量把数据分配均匀,每个链表长度大致相同,这个实现就在把数据存到哪个链表中的算法;
这个算法实际就是取模,hash%length,计算机中直接求余效率不如位移运算,源码中做了优化hash&(length-1),
hash%length==hash&(length-1)的前提是length是2的n次方;
为什么这样能均匀分布减少碰撞呢?2的n次方实际就是1后面n个0,2的n次方-1 实际就是n个1;
例如长度为9时候,3&(9-1)=0 2&(9-1)=0 ,都在0上,碰撞了;
例如长度为8时候,3&(8-1)=3 2&(8-1)=2 ,不同位置上,不碰撞

5.为什么转换成红黑树的节点是8

理想情况下使用随机的哈希码,容器中节点分布在hash桶中的频率遵循泊松分布按照泊松分布的计算公式计算出了桶中元素个数和概率的对照表,可以看到链表中元素个数为8时的概率已经非常小,再多的就更少了,所以创作者在选择链表元素个数时选择了8,是根据概率统计而选择的。
参照下图在这里插入图片描述

6.hashmap的构造函数哪些?
HashMap提供了4个构造函数:

  1. public HashMap(int initialCapacity, float loadFactor)
  2. public HashMap(int initialCapacity)
  3. public HashMap()
  4. public HashMap(Map<? extends K, ? extends V> m)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值