HashMap的原理

最新推荐文章于 2024-09-12 08:41:04 发布

Matthew117

最新推荐文章于 2024-09-12 08:41:04 发布

阅读量43

点赞数

分类专栏： java8 文章标签： java-ee

本文链接：https://blog.csdn.net/Matthew93/article/details/132082485

版权

java8 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

HashMap是Java中常用的数据结构，用于存储键值对，并可以根据键快速查找值。它基于哈希表实现，其底层原理包括以下几个关键点：

哈希函数：HashMap使用哈希函数将键映射到数组索引上。哈希函数是一个确定性函数，它将键映射为一个整数值，然后将该整数值作为数组的索引。Java中的哈希函数一般通过对键的hashCode()方法返回值进行一系列的位运算和变换得到。
数组和链表/红黑树：HashMap内部维护了一个数组，数组中的每个元素称为桶（Bucket）。每个桶存储一个链表或红黑树结构。当多个键哈希到相同的数组索引位置时，它们会以链表形式存储在同一个桶中。但是当链表长度过长时，链表会转换为红黑树，以提高查找效率。
解决哈希冲突：由于哈希函数可能将不同的键映射到相同的数组索引，导致哈希冲突。当发生冲突时，HashMap采用链地址法来解决，即将冲突的键值对以链表形式存储在同一个桶中。当链表长度过长时，会转换为红黑树来加快查找速度。
负载因子和扩容：HashMap有一个负载因子(load factor)的概念，它表示当前哈希表中已存储的元素个数与数组长度的比值。当负载因子超过一定阈值时，HashMap会触发扩容操作，即创建一个更大的数组，并将原来的键值对重新计算哈希后插入新数组中。扩容是为了减少哈希冲突，从而保持HashMap的高效性。
并发安全问题：HashMap在多线程环境下不是线程安全的，当多个线程同时修改HashMap时，可能导致数据不一致或抛出ConcurrentModificationException异常。Java提供了ConcurrentHashMap来解决这个问题，它是HashMap的线程安全版本。

总结：
HashMap通过哈希函数将键映射为数组索引，使用链表/红黑树解决哈希冲突，并且通过负载因子和扩容机制保持了高效性。但需要注意，在多线程环境下使用HashMap需要进行额外的同步操作，或者使用ConcurrentHashMap来确保线程安全。

假设我们有一个HashMap，初始时底层数组的长度为8。我们要存储键值对(key1, value1)和(key2, value2)。

哈希函数：对于key1和key2，我们先使用它们的hashCode()方法计算哈希值，然后再将哈希值通过一系列位运算得到它们在数组中的索引位置。

数组和链表：我们得到了两个键的哈希值，并根据哈希值计算出它们在数组中的索引位置。假设key1的哈希值为h1，key2的哈希值为h2，它们在数组中的索引分别为index1和index2。

如果index1和index2相同，即发生了哈希冲突。此时，我们将(key1, value1)和(key2, value2)以链表形式存储在同一个桶中，即数组中的index1位置上。这样，这个桶中就存储了多个键值对。

负载因子和扩容：随着键值对的不断存储，负载因子逐渐增加。当负载因子超过一定阈值（默认是0.75）时，HashMap触发扩容操作。此时，它会创建一个更大的数组（例如原来长度的两倍），并将原来的键值对重新计算哈希后插入新数组中。这样做是为了减少哈希冲突，保持HashMap的高效性。

链表转换为红黑树：在JDK 8之后的HashMap中，当链表长度超过8时，链表会自动转换为红黑树。红黑树是一种高效的自平衡二叉查找树，它能够在O(log n)时间内查找元素，相比较于链表，大大提高了查找效率。

通过上述的操作，HashMap能够高效地存储和查找键值对，实现了快速的插入、删除和查找操作。