HashMap的底层实现原理

HashMap的底层实现原理

  • HashMap底层实现采用的是哈希表,一种非常重要的数据结构
  • 哈希表的基本结构是:数组+链表
  • 数组的特点:占用空间连续,寻址容易,查询速度快.但是,增加和删除的效率非常低
  • 链表的特点:占用空间不连续,寻址困难,查询速度慢.但是,增加和删除的效率非常高
  • HashMap源码两个核心内容:Entry[] table 就是HashMap的核心数组结构,也称之为位桶数组;Entry对象是一个单向链表的结构,里面存储了四个重要的属性hash,key,value,next

如下图:

在这里插入图片描述

  • HashMap存储数据的过程put(key,value)如下:
    在这里插入图片描述

步骤如下:

1、获得key对象的hashcode–首先调用key对象的hashcode()方法,获得hashcode.

2、根据hashcode计算出hash值(要求在[0,数组长度-1]区间),hashcode是一个整数,需要将它转化为[0,数组长度-1]的范围,要求转化后的hash值尽量均匀地分布在[0,数组长度-1]这个区间,减少"hash冲突".

  • 一种极端简单和低下的算法:
    hash值 = hashcode/hashcode;
    也就是说,hash值总是1,意味着键值对对象会存储到数组索引1位置,这样就形成一个非常长的链表,相当于每存储一个对象都会发生"hash冲突",HashMap也退化为一个"链表".
  • 一种简单和常用的算法是(相除取余算法):
    hash值 = hashcode%数组长度
    这种算法可以让hash值均匀的分布在[0,数组长度-1]的区间,早期的HashTable就是采用这种算法。但是,这种算法由于使用了"除法",效率低下。JDK后来改进了算法,首先约定数组长度必须为2的整数幂,这样采用位运算即可实现取余的效果:hash值 = hashcode&(数组长度-1)
/**
 * 测试hash算法
 */
public class TestHash {
	public static void main(String[] args) {
		int hashcode = 1111;
		int length = 16;//length为2的整数幂,则hashcode&(length-1)相当于hashcode%length
		myhash(hashcode, length);
	}
	public static void myhash(int hashcode,int length){
		//取余
		System.out.println(hashcode%length);
		//length为2的整数幂情况下,和取余的值一样
		System.out.println(hashcode&(length-1));
	}
}

3、生成Entry对象

  • 一个Entry对象包含四个部分,key对象、value对象、hash值、指向下一个Entry对象的引用,现在算出了hash值,下一个Entry对象的引用为null。

4、将Entry对象放到table数组中

  • 如果本Entry对象对应的数组索引位置还没有放Entry对象,则直接将Entry对象存储进数组,如果对应索引位置已经有Entry对象,则将已有Entry对象的next指向本Entry对象,形成链表。

总结上述过程:

当添加一个元素(key,value)时,首先计算key的hash值,以此确定插入数组中的位置,但是可能存在同一hash值的元素已经被放在数组的同一位置了,这时就添加到同一hash值元素的后面,他们在数组的同一位置,就形成了链表,同一个链表上的hash值是相同的,所以说数组存放的是链表。JDK8中,当链表长度大于8时,链表就转化为红黑树,这样又大大提高了查找速度。

  • 取数据过程get(key)
    1、获得key的hashcode,通过hash()散列算法得到hash值,进而定位到数组的位置
    2、在链表上挨个比较key对象,调用equals()方法,将key对象和链表上的所有的key对象进行比较,直到碰到返回true的节点对象为止。
    3、返回equals()为true的节点对象为value对象
  • java中规定,两个内容相同(equals()为true)的对象必须具有相等的hashcode。因为如果equals()为true而两个对象的hashcode不同,那在整个存储过程中就发生了悖论。
  • 扩容问题:HashMap的位桶数组,初始大小为16,实际使用的时候,大小是可变的。如果位桶数组中的元素达到(0.75*数组length),就重新调整数组的大小为原来的2倍。扩容很耗时,扩容的本质是定义更大的数组,并将旧数组内容挨个拷贝到新数组中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值