HashMap的底层实现原理

最新推荐文章于 2024-09-02 21:23:59 发布

咖啡C我

最新推荐文章于 2024-09-02 21:23:59 发布

阅读量352

点赞数

分类专栏： java

本文链接：https://blog.csdn.net/qq_40238743/article/details/102532515

版权

java 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

HashMap的底层实现原理

HashMap底层实现采用的是哈希表，一种非常重要的数据结构
哈希表的基本结构是:数组+链表
数组的特点：占用空间连续，寻址容易，查询速度快.但是，增加和删除的效率非常低
链表的特点：占用空间不连续，寻址困难，查询速度慢.但是，增加和删除的效率非常高
HashMap源码两个核心内容：Entry[] table 就是HashMap的核心数组结构，也称之为位桶数组；Entry对象是一个单向链表的结构，里面存储了四个重要的属性hash,key,value,next

如下图：

在这里插入图片描述

HashMap存储数据的过程put(key,value)如下：

步骤如下：

1、获得key对象的hashcode–首先调用key对象的hashcode()方法，获得hashcode.

2、根据hashcode计算出hash值(要求在[0,数组长度-1]区间)，hashcode是一个整数，需要将它转化为[0,数组长度-1]的范围，要求转化后的hash值尽量均匀地分布在[0,数组长度-1]这个区间，减少"hash冲突".

一种极端简单和低下的算法:
hash值 = hashcode/hashcode;
也就是说，hash值总是1，意味着键值对对象会存储到数组索引1位置，这样就形成一个非常长的链表，相当于每存储一个对象都会发生"hash冲突"，HashMap也退化为一个"链表".
一种简单和常用的算法是(相除取余算法):
hash值 = hashcode%数组长度
这种算法可以让hash值均匀的分布在[0,数组长度-1]的区间，早期的HashTable就是采用这种算法。但是，这种算法由于使用了"除法"，效率低下。JDK后来改进了算法，首先约定数组长度必须为2的整数幂，这样采用位运算即可实现取余的效果：hash值 = hashcode&(数组长度-1)

/**
 * 测试hash算法
 */
public class TestHash {
	public static void main(String[] args) {
		int hashcode = 1111;
		int length = 16;//length为2的整数幂，则hashcode&(length-1)相当于hashcode%length
		myhash(hashcode, length);
	}
	public static void myhash(int hashcode,int length){
		//取余
		System.out.println(hashcode%length);
		//length为2的整数幂情况下，和取余的值一样
		System.out.println(hashcode&(length-1));
	}
}

3、生成Entry对象

一个Entry对象包含四个部分，key对象、value对象、hash值、指向下一个Entry对象的引用，现在算出了hash值，下一个Entry对象的引用为null。

4、将Entry对象放到table数组中

如果本Entry对象对应的数组索引位置还没有放Entry对象，则直接将Entry对象存储进数组，如果对应索引位置已经有Entry对象，则将已有Entry对象的next指向本Entry对象，形成链表。

总结上述过程：

当添加一个元素(key,value)时，首先计算key的hash值，以此确定插入数组中的位置，但是可能存在同一hash值的元素已经被放在数组的同一位置了，这时就添加到同一hash值元素的后面，他们在数组的同一位置，就形成了链表，同一个链表上的hash值是相同的，所以说数组存放的是链表。JDK8中，当链表长度大于8时，链表就转化为红黑树，这样又大大提高了查找速度。

取数据过程get(key)
1、获得key的hashcode,通过hash()散列算法得到hash值，进而定位到数组的位置
2、在链表上挨个比较key对象，调用equals()方法，将key对象和链表上的所有的key对象进行比较，直到碰到返回true的节点对象为止。
3、返回equals()为true的节点对象为value对象
java中规定，两个内容相同(equals()为true)的对象必须具有相等的hashcode。因为如果equals()为true而两个对象的hashcode不同，那在整个存储过程中就发生了悖论。
扩容问题：HashMap的位桶数组，初始大小为16，实际使用的时候，大小是可变的。如果位桶数组中的元素达到(0.75*数组length)，就重新调整数组的大小为原来的2倍。扩容很耗时，扩容的本质是定义更大的数组，并将旧数组内容挨个拷贝到新数组中。