一、前言
在Java 7及之前的版本中,HashMap的底层数据结构主要是数组加链表,在Java 8中,HashMap的底层数据结构是数组+链表+红黑树的组合。
二、底层数据结构
1. 数组
初始化和扩容:HashMap首先会初始化一个指定长度的数组,作为存储数据的基本结构。当哈希表中的条目数超出了加载因子(默认为0.75)与当前容量的乘积时,会进行扩容操作,数组长度会扩展为大于原长度2倍的最近的2的n次方的值。
存储位置:通过哈希函数计算键的哈希码,然后使用哈希码来确定键值对在数组中的存储位置(即数组的下标)。
2. 链表
哈希冲突:当不同的键通过哈希函数计算后得到相同的数组下标时,即发生了哈希冲突。此时,这些键值对会形成一个链表,存储在同一个数组元素(桶)中。
链表长度:在Java 8之前,链表是处理哈希冲突的唯一方式。而在Java 8中,当链表长度较短时(默认阈值为8之前),仍然使用链表来存储冲突的键值对。
3. 红黑树
链表过长时的优化:在Java 8中,当链表中的元素数量超过一定阈值(默认为8)时,并且数组的长度大于或等于64,链表会转换为红黑树。这是为了优化在链表较长时的查找效率,因为红黑树在查找、插入和删除操作上的性能通常优于链表。
保持性能:红黑树的引入使得HashMap在处理大量数据和高哈希冲突时,仍然能够保持较高的性能。
三、java8之前版本的区别
性能优化:在Java 8之前,当哈希冲突较多时,链表会越来越长,导致查找效率下降。而在Java 8中,当链表长度超过阈值时,会自动转换为红黑树,从而保持较高的查找效率。
空间复杂度:引入红黑树虽然提高了性能,但也增加了空间复杂度。因为红黑树节点需要额外的空间来存储父节点指针、颜色标记等信息。然而,这种空间上的开销通常是可以接受的,因为它带来了性能上的显著提升。
扩容逻辑:无论是Java 8之前还是之后,HashMap的扩容逻辑都是类似的。当哈希表中的条目数超出了加载因子(默认为0.75)与当前容量的乘积时,会进行扩容操作。扩容时,数组长度会扩展为大于原长度2倍的最近的2的n次方的值。
哈希冲突解决:无论是链表还是红黑树,都是HashMap解决哈希冲突的方法。在Java 8之前,只使用链表;而在Java 8及以后版本中,当链表长度过长时,会转换为红黑树以提高性能。
综上所述,Java 8中HashMap的底层数据结构通过引入红黑树来优化性能,特别是在处理大量数据和高并发场景时表现更为出色。这种设计使得HashMap在保持灵活性和易用性的同时,也具备了较高的性能和可扩展性。