【后端那些事儿】Java的HashMap数据结构详解

最新推荐文章于 2024-07-14 20:30:00 发布

刘循源

最新推荐文章于 2024-07-14 20:30:00 发布

阅读量1.1k

点赞数 29

分类专栏：后端文章标签： java 开发语言

本文链接：https://blog.csdn.net/LiuXunYuan/article/details/135620462

版权

后端专栏收录该内容

6 篇文章 0 订阅

订阅专栏

什么是HashMap

在Java中，HashMap是一个常见的集合类，它实现了Map接口，提供了键值对存储和检索的功能。下面对Java中的HashMap进行详细解析：

原理：HashMap底层采用数组和链表（或红黑树）的结合来实现。当哈希冲突发生时，采用链表或红黑树来处理冲突，以提高查找效率。
特点：
- 键的唯一性：HashMap中的键是唯一的，如果插入的键已经存在，则会进行替换。
- 元素的无序性：HashMap中的元素存储是无序的，不是按照插入顺序来存储。
- 允许null键和null值：HashMap允许将null作为键或值。
使用方法：
- 添加元素：使用put(key, value)方法将键值对添加到HashMap中。
- 删除元素：使用remove(key)方法根据键删除对应的键值对。
- 获取元素：使用get(key)方法根据键获取对应的值。
- 判断是否包含键或值：使用containsKey(key)和containsValue(value)方法。
初始容量和负载因子：HashMap在创建时，可以指定其初始容量和负载因子。初始容量是指HashMap中可以容纳的键值对的个数，默认为16；负载因子是指HashMap在扩容时，达到多少比例时进行扩容，默认为0.75。当HashMap中元素的数量达到初始容量乘以负载因子时，就会进行扩容。
遍历方式：可以通过迭代器、forEach循环和keySet()、values()、entrySet()等方法来遍历HashMap中的键值对。

HashMap的应用场景

HashMap在Java中的应用场景非常广泛，常见的应用场景包括但不限于以下几种：

1. 缓存：HashMap可以作为缓存数据的容器，其中键可以是用于快速检索数据的索引，值可以是从数据库或其他耗时操作中获取的数据。通过在HashMap中保存数据，可以避免重复获取数据，提高系统性能。

2. 数据索引：HashMap可以作为索引数据的容器，其中键可以用于唯一标识数据，值可以存储数据的引用。这样可以快速根据键来获取对应的数据，而无需遍历整个数据集。

3. 缓存控制：HashMap可以用于实现缓存的过期机制。通过为每个键值对设置过期时间，在访问时判断是否过期，如果过期则移除。这样可以减少内存的占用。

4. 数据分组：HashMap可以通过键值对的方式将数据分组，键可以是用于区分不同组的标识，值可以是属于同一组的数据集合。通过HashMap的键值对结构，可以方便地按照组进行数据的存储和检索。

5. 缓存数据的排序：HashMap在Java8及以后的版本中，可以通过Stream API和Lamdba表达式对键值对进行排序。这样可以方便地对缓存数据进行排序操作，提高数据的展示效果。

需要注意的是，由于HashMap是非线程安全的，如果在多线程环境下使用，需要进行额外的同步处理，或者使用线程安全的Map实现类，如ConcurrentHashMap。

什么是红黑树

红黑树是一种自平衡的二叉搜索树数据结构。它在每个节点上增加了一个额外的"颜色"属性，可以是红色或黑色。红黑树满足以下性质：

1. 每个节点要么是红色，要么是黑色。
2. 根节点是黑色。
3. 每个叶子节点（空节点）是黑色。
4. 如果一个节点是红色，那么它的子节点必须是黑色。
5. 从任意节点到其每个叶子节点的路径上包含相同数量的黑色节点。

这些性质确保了红黑树的平衡性，使得最长路径不会超过最短路径的两倍，保证了树的查找、插入和删除的性能都能在对数时间复杂度内完成。

为什么选用红黑树作为底层的数据结构

Java中的HashMap在内部使用了一个数组来存储键值对，这个数组被称为哈希桶（hash bucket）。当键值对被放入哈希桶中时，HashMap会根据键的哈希值来计算它在数组中的索引位置，然后将键值对放入该位置。

然而，随着元素的不断插入，哈希桶可能会出现哈希冲突，即不同键计算得到的索引位置相同。为了解决哈希冲突，Java的HashMap使用了链地址法，即在同一个索引位置上，将冲突的键值对使用链表连接起来。

然而，当链表中的元素数量较多时，链表的遍历操作会变得比较耗时，因为它需要遍历整个链表才能找到目标键值对。为了提高性能，当链表的长度超过阈值（默认为8）时，Java的HashMap会将链表转换为红黑树。

红黑树是一种自平衡的二叉搜索树，它的插入、删除和查找操作的时间复杂度都是O(logN)。相比于链表，红黑树的查找速度更快，特别是当键值对较多时。

因此，Java的HashMap使用红黑树来优化具有较长链表的情况，以提高查找性能。然而，当链表中的元素数量变少，红黑树的复杂性会使得性能下降，因此在链表长度小于6时，Java的HashMap会将红黑树转换回链表。这样，HashMap能够根据元素数量的变化，灵活地选择使用链表或红黑树来存储键值对，以实现最佳的性能。