hashmap底层原理_周末自己动手撸一个 HashMap,美滋滋

本文通过分析HashMap的底层设计思想,包括hash函数、数组、单链表以及解决碰撞的方法,详细讲解了如何实现一个简单的HashMap。作者讨论了如何构造Entry、put操作的实现、resize和rehash的策略,以及get操作的处理。通过实例代码,读者能更深入地理解HashMap的工作原理,并提供了一组测试用例验证实现。
摘要由CSDN通过智能技术生成
  • 对HashMap的思考
  • 通过写一个迷你版的HashMap来深刻理解
    • 定义接口
    • 接口实现
    • 看MyHashMap的构造
    • Entry
    • 看put如何实现
    • hash函数
    • resize和rehash
    • get实现
    • Test测试
    • 运行结果

  • 《Java 2019 超神之路》
  • 《Dubbo 实现原理与源码解析 —— 精品合集》
  • 《Spring 实现原理与源码解析 —— 精品合集》
  • 《MyBatis 实现原理与源码解析 —— 精品合集》
  • 《Spring MVC 实现原理与源码解析 —— 精品合集》
  • 《Spring Boot 实现原理与源码解析 —— 精品合集》
  • 《数据库实体设计合集》
  • 《Java 面试题 —— 精品合集》
  • 《Java 学习指南 —— 精品合集》

HashMap是Java中常用的集合,而且HashMap的一些思想,对于我们平时解决业务上的一些问题,在思路上有帮助,基于此,本篇博客将分析HashMap底层设计思想,并手写一个迷你版的HashMap!

对HashMap的思考

2ebcff09e090a9798d40addd7ccdfa29.png

HashMap底层数据结构

第一,如图所示,HashMap有3个要素:hash函数+数组+单链表 第二,对于hash函数而言,需要考虑些什么? 要快,对于给定的Key,要能够快速计算出在数组中的index。那么什么运算够快呢?显然是位运算! 要均匀分布,要较少碰撞。说白了,我们希望通过hash函数,让数据均匀分布在数组中,不希望大量数据发生碰撞,导致链表过长。那么怎么办到呢?也是利用位运算,通过对数据的二进制的位进行移动,让hash函数得到的数据散列开来,从而减低了碰撞的概率。 如果发生了碰撞怎么办?上面的图其实已经说明了JDK的HashMap是如何处理hash冲突的,就是通过单链表解决的。那么除了这个方法,还有其他思路么?比如说,如果发生冲突,那么记下这个冲突的位置为index,然后在加上固定步长,即index+step,找到这个位置,看一下是否仍然冲突,如果继续冲突,那么按照这个思路,继续加上固定步长。其实这就是所谓的线性探测来解决Hash冲突的方法!

通过写一个迷你版的HashMap来深刻理解

定义接口

d6a0b7d7e706afb6473c14473127b609.png
定义一个接口,对外暴露快速存取的方法。 注意MyMap接口内部定义了一个内部接口Entry。

接口实现

1d44d735f8cedceb7a83a2fd2e10e724.png
HashMap的要素之一,就是数组,自然在这里,我们要定义数组,数组的初始化大小,还要考虑扩容的阀值。

看MyHashMap的构造

0db69397882fb176303f82757b8ded2e.png
构造方法有什么好说的呢? 仔细观察下,你会发现,其实这里使用到了“门面模式”。这里的2个构造方法其实指向的是同一个,但是对外却暴露了2个“门面”!

Entry

af0667719a8a6e13b2c66a4cdffab62d.png
HashMap的要素之一,单链表的体现就在这里!

看put如何实现

933237e5e66dad8c29137a75e63720d5.png
第一,要考虑是否扩容? HashMap中的Entry的数量(数组以及单链表中的所有Entry)是否达到阀值? 第二,如果扩容,意味着新生成一个Entry[],不仅如此还得重新散列。 第三,要根据Key计算出在Entry[]中的位置,定位后,如果Entry[]中的元素为null,那么可以放入其中,如果不为空,那么得遍历单链表,要么更新value,要么形成一个新的Entry“挤压”单链表!

hash函数

690c1be8600d5b297a1dcf4598c88048.png

95e9d6c18a3cd360e98248354d9e7235.png

JDK的HashMap提供的hash函数

我这里参考了JDK的HashMap的hash函数的实现,这里也再次说明了:要想散列均匀,就得进行二进制的位运算!

resize和rehash

94e0db787c9cf1948a8e67f9bf12fe96.png
这里可以看出,对于HashMap而言,如果频繁进行resize/rehash操作,是会影响性能的。 resize/rehash的过程,就是数组变大,原来数组中的entry元素一个个的put到新数组的过程,需要注意的是一些状态变量的改变。

get实现

1964f5a7f40f678451ff5f32f8d3757e.png
get很简单,只需要注意在遍历单链表的过程中使用== or equals来判断下即可。

Test测试

7e80d30a51ffe02fa205cd4cfb80951e.png

运行结果

65eb2b87a3cf15eccd1b8fcbb10b701d.png

OK,一个迷你版的HashMap就写好了,你学到了么?

周末愉快!

See u next blog!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值