每日面试题打卡（容器篇）——Day10

最新推荐文章于 2024-06-19 15:09:37 发布

九天漩女

最新推荐文章于 2024-06-19 15:09:37 发布

阅读量976

点赞数

分类专栏：面试题打卡文章标签：散列表 java 容器

本文链接：https://blog.csdn.net/qq_35754976/article/details/123535812

版权

面试题打卡专栏收录该内容

23 篇文章 1 订阅

订阅专栏

博主个人博客网站：文客
这个系列会长期更新！
如果你想每天和我打卡面试题、交流技术，可以关注一下我的个人博客网站：文客，我会每天在这里更新技术文章和面试题，也会及时收到大家的评论与留言，欢迎各位大佬来交流！

说一下HashMap的实现原理

HashMap主要用来存储键值对，它基于哈希表的Map接口实现，是最常用的Java集合之一，是非线程安全的。

HashMap可以存储null的key和null的value，不过为null的key只能有一个，而null的value可以有多个。

从底层数据结构来说，在JDK1.8之前，HashMap由“数组 + 链表”实现，数组是HashMap的主体，链表则是为了解决哈希冲突而存在的（拉链法解决哈希冲突）。在JDK1.8以后，HashMap在解决哈希冲突时有了较大变化，当链表长度大于阈值（默认为8），这时会判断数组的长度，如果数组长度小于64，那么会选择对数组扩容，如果大于等于64，那么会将链表转换为红黑树，提高搜索效率。

HashMap是基于Hash算法实现的：

当我们put一个元素时，利用key的hashCode重新hash计算出当前元素在集合中的下标
如果出现hash值相同的key，此时有两种情况：如果两个key相同，那么覆盖原始值；如果两个key不同，则将当前的值放入链表中
获取时，直接找到hash值对应的下标，再进一步判断key时候相等，从而找到对应的值

HashMap的默认的初始化大小是16，之后每次扩容都会变为原来的两倍。并且，HashMap总是使用2的幂作为哈希表的大小。

HashMap在JDK1.7和JDK1.8中有哪些不同？HashMap的底层实现

在JDK1.8之前，HashMap的底层数据结构时“数组 + 链表”，也叫做链表散列。

HashMap通过key的hashCode经过扰动函数处理过后得到hash值，然后通过(n - 1) & hash判断当前元素存放的位置（这里的n指的是数组长度），如果当前位置存放元素的话，那么就判断与要存入的数据的key是否相同，如果相同，直接覆盖，不相同就用拉链法解决冲突。

所谓扰动函数就是指的HashMap的hash方法，使用hash方法就是为了防止一些比较差的hashCode()方法，换句话说使用扰动函数之后可以减少碰撞。

所谓拉链法就是将链表与数组结合，也就是一个链表数组，数组中的每一个格就是链表的头，如果遇到哈希冲突，将冲突的值直接放入链表即可。

再来说一下JDK1.8之前HashMap的put方法，HashMap对于添加元素只提供了put方法，putVal方法是内部提供给put方法调用的。在put时，如果当前定位到的方法没有元素，则直接插入，如果当前定位到的位置有元素，遍历以这个元素为头节点的链表，依次和插入的key比较，如果key相同则直接覆盖，如果不同就采用头插法插入元素。

在JDK1.8以后，相较于之前的版本，JDK1.8在解决哈希冲突上有了较大的变化。

当链表长度大于阈值（默认为8）时，首先会根据HashMap数组的情况来决定是否转变为红黑树，如果数组的长度小于64，那么先会对数组进行扩容，如果数组长度大于等于64，此时将链表转换为红黑树，以减少搜索时间。

同时JDK1.8也对扰动次数进行了优化，减少了扰动次数，效率比JDK1.8之前更高。

JDK1.8也对HashMap的put 方法进行了改动，如果定位到的位置没有元素，则直接插入，如果定位到的位置有元素，遍历以该位置为头节点的链表，如果有相同的key则直接覆盖。如果没有相同的key，就判断节点是否为树节点，如果是那就调用putTreeVal方法将元素加入，如果不是就尾插法插入（JDK1.7是头插）。

HashMap的加载因子loadFactory

loadFactory加载因子用于控制数组存放数据的疏密程度，loadFactory越趋近于1，那么数组中存放的数据也就越多，也就越密，也就是会让链表的长度增加。loadFactory越小，也就是趋近于0，数组中存放的元素也就越少，越稀疏。

loadFactory太大会导致查找元素效率低，太小导致数组利用率低，存放的数据很分散。loadFactory的默认值是0.75f，这是官方给出的比较好的临界值。

HashMap的默认容量是16，负载因子为0.75f，当数据量达到16 * 0.75 = 12 时就需要将当前16的容量进行扩容，而扩容过程涉及到rehash、复制数据等操作，非常消耗性能。

HashMap的装载因子threshold

装载因子 = 容量 * 加载因子，它是一个衡量数组是否需要扩容的一个标准，如果size大于了装载因子，那么就要考虑对数组进行扩容了。

HashMap的put方法的具体流程？

put操作首先会判断键值对数组table[i]是否为空或者为null，否则执行resize()方法进行扩容。然后根据key的hashCode计算hash值计算索引i，这里会调用hash函数，hash函数大概作用是：高16bit不变，低16bit和高16bit做一次异或操作，目的是为了减少碰撞，如果table[i]为空，直接新建节点添加，如果table[i]不为空，则会依次判断是否有相同的key，如果相同则直接覆盖，如果不同则会判断当前节点是否为树节点，如果是树节点，调用putTreeVal方法插入键值对，如果不是树节点，遍历链表，判断链表长度是否大于8，如果大于8，将链表转化为红黑树再进行插入操作，如果小于8，直接尾插到链表。插入成功后，判断实际存在的键值对数量size是否超过了装载因子，如果超过，进行resize扩容。

HashMap的扩容操作是怎么实现的？

在jdk1.8中，resize方法是在hashmap中的键值对大于阀值时或者初始化时，就调用resize方法进行扩容；
每次扩展的时候，都是扩展2倍；
扩展后Node对象的位置要么在原位置，要么移动到原偏移量两倍的位置。

在putVal()中，我们看到在这个函数里面使用到了2次resize()方法，resize()方法表示的在进行第一次初始化时会对其进行扩容，或者当该数组的实际大小大于负载因子（第一次为12），这个时候在扩容的同时也会伴随的桶上面的元素进行重新分发，这也是JDK1.8版本的一个优化的地方，在1.7中，扩容之后需要重新去计算其Hash值，根据Hash值对其进行分发，但在1.8版本中，则是根据在同一个桶的位置中进行判断(e.hash & oldCap)是否为0，重新进行hash分配后，该元素的位置要么停留在原始位置，要么移动到原始位置+增加的数组大小这个位置上

博客原文地址

每日面试题打卡（容器篇）——Day10
在这里插入图片描述

九天漩女

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
每日面试题打卡（容器篇）——Day10

博主个人博客网站：文客这个系列会长期更新！如果你想每天和我打卡面试题、交流技术，可以关注一下我的个人博客网站：文客，我会每天在这里更新技术文章和面试题，也会及时收到大家的评论与留言，欢迎各位大佬来交流！说一下HashMap的实现原理HashMap主要用来存储键值对，它基于哈希表的Map接口实现，是最常用的Java集合之一，是非线程安全的。HashMap可以存储null的key和null的value，不过为null的key只能有一个，而null的value可以有多个。从底层数据结构来说，在JDK1
复制链接

扫一扫