5千字长文，深度总结HashMap底层实现&面试题【收藏】

最新推荐文章于 2024-05-18 16:42:38 发布

2301_79655589

最新推荐文章于 2024-05-18 16:42:38 发布

阅读量615

点赞数 21

分类专栏：程序员文章标签： java 面试开发语言

本文链接：https://blog.csdn.net/2301_79655589/article/details/138264924

版权

程序员专栏收录该内容

190 篇文章 0 订阅

订阅专栏

删除元素

map1.remove(“TOM”);//根据键，去删除键值对

map1.clear(); //删除map1的所有元素

元素个数

int size = map1.size(); //返回当前集合中的键值对数量

查找是否包含键（Key）

//查找map1是否有TOM这个键（Key）

boolean isContainsK = map1.containsKey(“TOM”);

查找是否包含值（Value）

//查找map1是否有猫，这个值（Value）

boolean isContainsV = map1.containsValue(“猫”);

map转Set

//将map集合，转换为Set类型的集合

Set<Map.Entry<String, String>> entry = map1.entrySet();

以上方法，都好理解，主要就是最后一个Map转为Set的这个方法，我们讲解一下。

因为Set集合，它只是存储一个类型的元素，而不像HashMap这样是键值对。所有当HashMap转为Set时，会将HashMap的键和值，打包成一个整体（Map.Entry<K,V>）,打包后的对象类型就是这个括号里面的。然后再将打包好的整体放入Set集合中，如下图所示：

就如上图，打包成Map.Entry<K,V>类型，再放入Set集合中。这样做的好处就是，可以使用迭代器（Iterator）进行遍历，因为Map接口是没实现Interable接口的，无法使用迭代器，只能转为Set集合，再使用迭代器。以下是使用迭代器的代码：

Set<Map.Entry<String, String>> entry = map1.entrySet();

for (Map.Entry<String,String> set : entry) {

//调用get方法，即可拿到键和值

String key = set.getKey();

String value = set.getValue();

}

还有值得注意的是，键重复的情况，假设目前HashMap中已经有了（“TOM”，“猫”）这一对键值。如果此时我再添加元素（“TOM”，“狗”），因为键是一样的，则会找到表中TOM的位置，将“狗”放入了表中，实现了覆盖的效果。如下代码：

HashMap<String,String> map1 = new HashMap<>();

map1.put(“TOM”, “猫”); //第一次放入

map1.put(“TOM”, “狗”); //第二次方法，则会将猫改写为狗

二、哈希函数

===============================================================

1、哈希函数的概念

在我们前面学习的所有数据结构中，无论是二叉树，还是链表，在增删查改的操作上，时间复杂度都还是有那么一点点不尽人意，拿搜索二叉树举例，当插入的数据有序时，会退化成链表，从而产生了平衡树。但平衡树的增删查改也只能做到O（logN）的水平，没法再快了。

但哈希函数可以做到O(1)的水平，这是一个非常恐怖的概念，增删查改都能做到O(1)的水平，快了不止多少倍。那么它到底是怎么实现的？我们来简单分析一下：

哈希函数：根据给定的数据，进行计算，得到一个地址，在这个地址的地方进行放入元素。

取出元素的时候，也只是根据数据计算一个地址，在该地址处取出元素。

这就是哈希函数简单的认识。就是根据一些计算，推导出一个地址。

比如：hash = 元素 % 10; 这样一个最简单的哈希函数公式，假设我们传递的数据,是99，则99 % 10 = 9。则在数组下标为9的位置放入数据……

但是还有一个问题就是：假设现在传递的数据是89，89 % 10 = 9。还是在下标为9 的位置进行插入数据。此时就发生了意外，当前9下标位置已经有数据了。

以上这样的情况，就称为哈希冲突。不同的关键字，根据相同的哈希函数计算出相同的哈希值，就是哈希冲突。

人们可以设计出精妙的哈希函数，来降低哈希冲突的概率，但是绝对不可能做到不发生冲突。也就是说，但我们添加元素足够多时，发生哈希冲突，是一个必然的现象。

常见的哈希函数，我们这里就不列举了，大家查一下就行。大多数人都不会去设计哈希函数，我们只需知道有这么个东西即可。

2、哈希冲突，该怎么办？

为了尽量降低哈希冲突，我们就得从两个方面着手：在发生冲突之前和发生冲突之后。

发生冲突之前：设计出精妙的哈希函数，存放数据的内存空间开辟大一点，还有就是有一个负载因子的概念。

负载因子：

也就是表中的元素除以哈希表的长度，就是负载因子。

负载因子的曲线图大致如下：

也就是说在负载因子达到一个界限的时候，就需要进行扩容，将数组扩大，即可降低负载因子。

以上方案只是在尽量预防发生冲突，那如果真的发生冲突了，又该怎么办？

哈希冲突后：

常见的解决哈希冲突的方法是：闭散列和开散列。

闭散列：也叫开放地址法，当发生哈希冲突的时候，说明此当前下标位置已经有数据了，此时我们只需沿着当前位置往下查找一个没放数据的位置，插入数据即可，如下：

在插入89时，发生了冲突，就在9下标的后面找到一个空位置插入数据，但是9下标后面没位置了，则从数组前面开始找。

那有人可能就会问，会不会整个数据都已经满了呢？？

不可能的！因为有一个负载因子在控制数组的大小，当负载因子达到一个值的时候，就会进行扩容。

以上的方法就称为线型探测法。沿着下标，一直往下找，找到一个空位就插入即可。但是这样做的不好之处就在于，发生冲突的所有数据都聚集在一块地方，对删除操作增加了不小的难度。

例如：假设现在需要删除99，那能直接将99拿走吗？如果拿走了，那89，又如何通过哈希函数取出呢？？

所有线型探测法，对于删除操作，采用了伪删除法，也就是说，有一个变量记录99的状态表示已经删除了。

除了线型探测，还有二次探测法，就是为了解决冲突的元素聚集在一块这个问题：二次探测法，将不在沿着冲突位置的下标一个一个往下找空位置，而是通过一个公式：待插入下标 = （冲突下标 + i 2）% m 。此处的i就是发生冲突的次数。比如89第一次插入时，会跟99第一次发生冲突，计算下一个下标后，发现下一位置还是冲突的，则i=2，一直往下推导……

最重要的就是开散列：

开散列：又叫链地址法。将发生冲突的元素，用一个单链表进行串连起来，将头节点，放入数组中即可。如下图：

将所有发生冲突的元素，用一个单链表串连起来即可。然后在这个单链表中一个个查找。

但是还是会出现意外，如果单链表的长度很长的话，还是做不到O(1)的时间复杂度，那么此时就需要将这个单链表，转换为一个哈希表，或者是建一个红黑树（JDK1.8之后）的形式。

以上两种方法，就是解决哈希冲突之后的方案，特别值得记住的就是开散列。

3、JDK1.8的HashMap源码

（1）构造方法

在JDK1.8之前，HashMap只是采用数组+单链表的形式进行存储，且当时的单链表是用头插法的形式插入节点的。

在JDK1.8之后，HashMap采用数组+单链表+红黑树的形式进行存储，且单链表是用尾插法的形式插入节点。

那么是怎么进行存储的，我们来简单分析一下源码：

无参构造方法，只是设置了负载因子，并没有设置HashMap底层数组的大小。所以，只调用构造方法，不调用put方法，数组大小是0。跟ArrayList是一样的，ArrayList在调用add时，会将数组大小设置为10。

有参构造方法：

切记：HashMap底层数组的大小，一定是2的某次方，假设调用方传递的是20，这个数并不是2的某次方，则会向上调整，取离20最近的，且还是2的某次方的数。这里的话，离20最近且还是2的某次方的数，就是32。

千万注意，HashMap底层数组大小，不一定就是new的时候的初始化容量。

其次，我们需要认识一下几个常见的成员变量，以便于我们后续读懂put方法。

（2）put方法

在读put方法前，一定需要理解上图中的几个成员变量的意义，然后再来读put方法，这样才不至于越看越懵。

首先第一步就是put方法，调用了putVal方法。这里需注意hash函数，设计的比较精妙。

hash函数，除了调用了hashCode方法以外，还将计算出来的hashCode的值右移了16位，然后再做与运算。因为hashCode放回的是int类型，右移16位是将这个数值的每一位都利用起来。

putVal方法

tab指向成员变量table数组，n就是当前数组的长度。

首先我们先来看第一条逻辑分支，628行。tab=table，首先是判断是否为null，第二判断就是数组的长度等于0的时候。当调用无参构造方法时，没有为数组分配大小和赋值等操作，所有此时调用put方法是，第628行的逻辑判断就是真：

第629行，tab=resize（）。人如其名，resize就是调整数组大小的。这个方法有两个作用：初始化数组大小和扩容。

最后

金三银四马上就到了，希望大家能好好学习一下这些技术点

学习视频：

大厂面试真题：

组的长度等于0的时候。当调用无参构造方法时，没有为数组分配大小和赋值等操作，所有此时调用put方法是，第628行的逻辑判断就是真：

第629行，tab=resize（）。人如其名，resize就是调整数组大小的。这个方法有两个作用：初始化数组大小和扩容。

最后

金三银四马上就到了，希望大家能好好学习一下这些技术点

学习视频：

[外链图片转存中…(img-SJ4ivu7T-1714254840548)]

大厂面试真题：

[外链图片转存中…(img-jmlvQmjB-1714254840548)]

本文已被CODING开源项目：【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

2301_79655589

关注

21
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
5千字长文，深度总结HashMap底层实现&面试题【收藏】

金三银四马上就到了，希望大家能好好学习一下这些技术点学习视频：大厂面试真题：组的长度等于0的时候。当调用无参构造方法时，没有为数组分配大小和赋值等操作，所有此时调用put方法是，第628行的逻辑判断就是真第629行，tab=resize（）。人如其名，resize就是调整数组大小的。初始化数组大小和扩容。金三银四马上就到了，希望大家能好好学习一下这些技术点学习视频：[外链图片转存中…
复制链接

扫一扫