Java 中 Map 的底层原理解析

最新推荐文章于 2024-09-17 22:10:19 发布

小于负无穷

最新推荐文章于 2024-09-17 22:10:19 发布

阅读量833

点赞数 28

文章标签： java 哈希算法开发语言后端

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_62512874/article/details/142127894

版权

Map 是 Java 中非常常用的集合类之一，它用于存储键值对 (key-value pairs)。Map 具有很多不同的实现类，其中最常用的就是 HashMap 和 TreeMap。在本文中，我们将详细探讨 Java 中 Map 的底层原理，重点关注 HashMap 的实现。

一、`Map` 的基本概念

在 Java 中，Map 是一个接口，它定义了一些操作方法，如存储键值对、根据键获取值、删除键值对等。常用的 Map 实现类包括：

HashMap：基于哈希表实现的，支持快速的查找和插入操作。
LinkedHashMap：HashMap 的子类，维护了插入顺序。
TreeMap：基于红黑树实现，键按照自然顺序或指定的比较器排序。

我们主要讨论 HashMap 的底层实现机制。

二、`HashMap` 的底层实现

HashMap 是 Java 中最常用的 Map 实现类，它是基于哈希表 (Hash Table) 的数据结构。HashMap 通过键的 hashCode 方法来计算存储位置，从而保证查找、插入、删除等操作的高效性。

1. 哈希表的工作原理

哈希表（Hash Table）通过将键的 hashCode() 转换为数组的索引位置来存储键值对。它的工作原理大致可以分为以下步骤：

哈希值计算：HashMap 会调用键对象的 hashCode() 方法，得到一个哈希值。这个哈希值是一个整数。
索引计算：将哈希值通过 HashMap 内部的算法转换为数组的索引位置。通常，HashMap 使用哈希值对数组长度取模来计算索引。
存储：根据计算出的索引位置将键值对存储在数组的相应位置。

2. 哈希冲突（Hash Collision）

由于数组的大小是有限的，而哈希值的范围非常大，所以不同的键可能会计算出相同的索引位置。这种情况称为哈希冲突。

Java 中 HashMap 通过链地址法来解决哈希冲突：当多个键对应的哈希值落在同一个索引时，HashMap 会在这个索引处形成一个链表，将多个键值对依次存储在链表中。

3. 扩容机制

当 HashMap 的装载因子（Load Factor）超过一定阈值（默认是 0.75）时，HashMap 会自动扩容。扩容的过程大致如下：

创建新的数组：数组的大小一般会是原来的两倍。
重新哈希：将原数组中的键值对重新计算哈希值并存储到新的数组中。

扩容是一个比较耗时的操作，所以在初始化 HashMap 时，合理地设置初始容量可以提高性能。

4. `HashMap` 的重要参数

初始容量 (Initial Capacity)：创建 HashMap 时，底层数组的初始大小，默认为 16。
装载因子 (Load Factor)：定义了 HashMap 多满时触发扩容，默认为 0.75。
扩容阈值：容量 * 装载因子。当实际元素个数超过这个值时，HashMap 将进行扩容。

三、`HashMap` 的实现细节

1. `put()` 方法

put() 方法用于向 HashMap 中添加键值对。它的流程如下：

计算键的哈希值，并通过哈希值计算出数组中的索引。
如果该位置为空，则直接将键值对存入该位置。
如果该位置不为空（即发生了哈希冲突），则遍历该位置的链表，检查是否存在相同的键：
- 如果找到相同的键，则更新其对应的值。
- 如果没有找到相同的键，则将新的键值对添加到链表末尾。

当链表的长度超过一定阈值（默认是 8）时，链表会转换为红黑树以提高查找效率。

2. `get()` 方法

get() 方法用于根据键查找对应的值。其流程如下：

计算键的哈希值，并通过哈希值计算出数组中的索引。
检查该索引位置是否有链表或红黑树：
- 如果存在链表或红黑树，则遍历或查找其中的节点，找到匹配的键，返回其对应的值。
- 如果未找到匹配的键，则返回 null。

3. `resize()` 方法

HashMap 的扩容操作在 resize() 方法中进行。当元素数量超过阈值时，HashMap 会将底层数组大小扩大为原来的两倍，并将所有元素重新分配到新的数组中。这是一个比较耗时的操作，因此频繁的扩容可能会影响性能。

四、`HashMap` 中的线程安全问题

HashMap 在多线程环境下是非线程安全的。如果多个线程同时对同一个 HashMap 进行修改操作，可能会导致数据不一致的问题。因此，在并发环境下，推荐使用 ConcurrentHashMap，它是一个线程安全的 Map 实现。

五、`TreeMap` 的底层实现

与 HashMap 基于哈希表不同，TreeMap 基于红黑树实现，所有的键按照自然顺序或提供的比较器顺序进行排序。

时间复杂度：与 HashMap 相比，TreeMap 的查找、插入和删除的时间复杂度为 O(log n)，适用于需要对键进行排序的场景。
有序性：TreeMap 保证了键的有序性，因此它非常适合用于需要按顺序访问键值对的场景。

六、总结

HashMap 是基于哈希表实现的，提供了 O(1) 的查找和插入性能，适用于大多数普通场景。
TreeMap 是基于红黑树实现的，提供了键的有序性，适用于需要排序存储的场景。
在多线程环境下，建议使用 ConcurrentHashMap 来保证线程安全。

理解 HashMap 和 TreeMap 的底层原理，有助于我们在开发过程中更好地选择合适的数据结构并提升程序性能。希望本文能帮助你深入理解 Map 的实现原理。

小于负无穷

关注

28
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

小于负无穷 CSDN认证博客专家 CSDN认证企业博客

码龄3年

84: 原创

7208: 周排名

1万+: 总排名

7万+: 访问

: 等级

2175: 积分

931: 粉丝

1334: 获赞

0: 评论

990: 收藏

私信

关注

热门文章

分类专栏

前端面试题汇总 16篇
前端大杂烩

最新评论

HTTP与HTTPS的区别详解：为何HTTPS是未来的首选
ha_lydms: 博主的文章一直都是我的学习指南，内容详实，让我从中获益良多，每篇博文都写的很好，你的博客内容深入浅出，期待你的下一次精彩分享
在Spring Boot项目中使用MySQL数据库
征途黯然.: 在SpringBoot项目中使用MySQL数据库 article is excellent and truly impressive.
Vue.js 中使用 AG Grid 实现高性能数据表格
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
使用 ECharts 进行数据可视化
旷世奇才李先生: 使用 ECharts 进行数据可视化，这篇文章很好，值得一读。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小于负无穷 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。