HashMap 在1.8里处理哈希冲突和性能方面的一些改进

龙大.

已于 2024-09-29 16:14:08 修改

阅读量312

点赞数 6

分类专栏： Java 文章标签：哈希算法散列表算法

于 2024-09-29 16:13:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014745465/article/details/142637797

版权

Java 专栏收录该内容

64 篇文章 0 订阅

订阅专栏

Java 1.8 引入了对 HashMap 的一些重要改进，特别是在处理哈希冲突和性能方面。以下是对 HashMap 1.8 实现逻辑的分析。

1. 数据结构

HashMap 的主要数据结构是数组和链表（或红黑树）：

数组：用于存储桶（buckets），每个桶可以包含多个键值对。
链表：在每个桶中，使用链表来存储哈希冲突的键值对。
红黑树：当链表的长度超过阈值（默认为 8）且当前容量（即桶的数量）达到一定阈值（默认为 64）时，链表会转换为红黑树，以提高查找效率。

2. 重要字段

HashMap 的核心字段包括：

Node<K,V>[] table：存储桶的数组。
int size：当前映射中键值对的数量。
int threshold：桶的阈值，当数组的大小超过这个值时，HashMap 会进行扩容。
float loadFactor：负载因子，决定了何时进行扩容，默认值为 0.75。

3. 构造函数

HashMap 提供多个构造函数，允许用户指定初始容量和负载因子。默认情况下，初始容量为 16，负载因子为 0.75。

4. 哈希函数

HashMap 使用 hash(Object key) 方法来计算键的哈希值。它会对键的哈希值进行处理，以减少碰撞的可能性。具体实现如下：

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

这个方法通过 XOR 操作和右移操作来增强哈希值的分布性。

5. 插入元素

插入元素的过程如下：

计算哈希值：使用 hash() 方法计算键的哈希值。
确定桶的位置：通过 indexFor(hash, table.length) 方法计算元素应该放置的桶的索引。
处理冲突：
- 如果桶为空，直接插入。
- 如果桶不为空，遍历链表检查是否存在相同的键：
  - 如果找到相同的键，更新值。
  - 如果没有找到，插入到链表的末尾。
  - 如果链表长度超过 8且前桶的数量大于等于 64，转换为红黑树。

6. 查找元素

查找元素的过程如下：

计算哈希值：使用 hash() 方法计算键的哈希值。
确定桶的位置：通过 indexFor(hash, table.length) 方法计算桶的索引。
遍历桶：
- 如果桶为空，返回 null。
- 如果桶中是链表，遍历链表查找键。
- 如果桶中是红黑树，使用树的查找方法。

7. 扩容

当 HashMap 中的元素数量超过 threshold 时，会触发扩容。扩容的过程如下：

新建一个更大的数组：通常是原数组大小的两倍。
重新计算每个元素的位置：遍历原数组的每个桶，将元素重新插入到新的桶中。
更新阈值：新的阈值为新数组大小乘以负载因子。

8. 性能优化

链表到红黑树的转换：当链表长度超过 8 时且前桶的数量大于等于 64，链表会转换为红黑树，以提高查找效率，从 O(n) 降低到 O(log n)。
使用 Node 类：HashMap 1.8 使用 Node 类来表示每个键值对，简化了结构。

关注

6
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

龙大. CSDN认证博客专家 CSDN认证企业博客

码龄10年

279: 原创

9825: 周排名

6140: 总排名

31万+: 访问

: 等级

6461: 积分

1871: 粉丝

2750: 获赞

43: 评论

1989: 收藏

私信

关注

热门文章

分类专栏

JVM 14篇
企业相关 3篇
杂谈 2篇
系统设计 19篇
Hbase 9篇
AI 9篇
Spark 14篇
Scala 1篇
Zookeeper 3篇
Redis 8篇
网络 3篇
设计模式 2篇
数据结构 1篇
MQ 1篇
Java 64篇
Android 4篇
Mysql 30篇
Eclipse 1篇
Tomcat 2篇
Maven 1篇
Spring 48篇
Hibernate
Mybatis
Elasticsearch 13篇
Git 3篇
Hive 8篇

最新评论

Java 并非所有的对象都放在堆中
龙大.: 嗯，你说的对，我这里说的不严谨，得分JDK 版本
Java 并非所有的对象都放在堆中
Ghost-Unison: 字符串常量池逻辑上属于方法区但物理上还是在堆上。jdk7及之后，字符串常量池从永久代中分离出来，直接放到堆内存中。jdk8及之后取消了永久代的概念，方法区从堆内存中剥离出来，放在直接内存的元空间中，但是字符串常量池还是在堆上，运行时常量池是在元空间中存字符串常量的引用。
B树、B+树、红黑树的定义、之间的区别、优缺点、数据结构、应用等
龙大.: 这个也得分场景，在数据库和文件系统中，B+ 树通常表现出更少的 I/O 操作，尤其在范围查询和高密度数据存储情况下。
B树、B+树、红黑树的定义、之间的区别、优缺点、数据结构、应用等
JOMO_main: b+树io更少吧
Spring 中AbstractRefreshableWebApplicationContext
穷苦书生_万事愁: 这篇文章对于Spring中的AbstractRefreshableWebApplicationContext的介绍非常详细，让我对这个主题有了更深入的了解。博主的讲解方式清晰易懂，细节描写到位，展现了其深厚的知识功底。我期待博主未来能继续分享更多优质内容，同时也希望能够得到博主的指导，一起共同进步。感谢博主的辛苦分享和支持！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。