HashMap底层原理解析

为了偷懒,部分内容直接copy了。然后附加几个hashMap中比较重要的点。

以下为转载————————————————原文链接:https://blog.csdn.net/qq_43370771/article/details/111353046
常见的数据结构有三种:
1、数组结构: 存储区间连续、内存占用严重、空间复杂度大
优点:随机读取和修改效率高,原因是数组是连续的(随机访问性强,查找速度快)
缺点:插入和删除数据效率低,因插入数据,这个位置后面的数据在内存中都要往后移动,且大小固定不易动态扩展。
2、链表结构:存储区间离散、占用内存宽松、空间复杂度小
优点:插入删除速度快,内存利用率高,没有固定大小,扩展灵活
缺点:不能随机查找,每次都是从第一个开始遍历(查询效率低)
3、哈希表结构:结合数组结构和链表结构的优点,从而实现了查询和修改效率高,插入和删除效率也高的一种数据结构
常见的HashMap就是这样的一种数据结构

在这里插入图片描述

HashMap中的put()和get()的实现原理:

1、map.put(k,v)实现原理
(1)首先将k,v封装到Node对象当中(节点)。
(2)然后它的底层会调用K的hashCode()方法得出hash值。
(3)通过哈希表函数/哈希算法,将hash值转换成数组的下标,下标位置上如果没有任何元素,就把Node添加到这个位置上。如果说下标对应的位置上有链表。此时,就会拿着k和链表上每个节点的k进行equal。如果所有的equals方法返回都是false,那么这个新的节点将被添加到链表的末尾。如其中有一个equals返回了true,那么这个节点的value将会被覆盖。
2、map.get(k)实现原理
(1)先调用k的hashCode()方法得出哈希值,并通过哈希算法转换成数组的下标。
(2)通过上一步哈希算法转换成数组的下标之后,在通过数组下标快速定位到某个位置上。如果这个位置上什么都没有,则返回null。如果这个位置上有单向链表,那么它就会拿着K和单向链表上的每一个节点的K进行equals,如果所有equals方法都返回false,则get方法返回null。如果其中一个节点的K和参数K进行equals返回true,那么此时该节点的value就是我们要找的value了,get方法最终返回这个要找的value。

为何随机增删、查询效率都很高的原因是?

原因: 增删是在链表上完成的,而查询只需扫描部分,则效率高。
HashMap集合的key,会先后调用两个方法,hashCode and equals方法,这这两个方法都需要重写。

为什么放在hashMap集合key部分的元素需要重写equals方法?

因为equals方法默认比较的是两个对象的内存地址

HashMap红黑树原理分析

相比 jdk1.7 的 HashMap 而言,jdk1.8最重要的就是引入了红黑树的设计,当hash表的单一链表长度超过 8 个的时候,链表结构就会转为红黑树结构。
为什么要这样设计呢?好处就是避免在最极端的情况下链表变得很长很长,在查询的时候,效率会非常慢。


红黑树查询:其访问性能近似于折半查找,时间复杂度 O(logn);
链表查询:这种情况下,需要遍历全部元素才行,时间复杂度 O(n);
简单的说,红黑树是一种近似平衡的二叉查找树,其主要的优点就是“平衡“,即左右子树高度几乎一致,以此来防止树退化为链表,通过这种方式来保障查找的时间复杂度为 log(n)。

以上为转载————————————————原文链接:https://blog.csdn.net/qq_43370771/article/details/111353046

关于红黑树下次开一篇一起学习了解一下,下面讲讲HashMap中常见的几个重要问题。

什么是Hash碰撞?怎么解决?

Hash碰撞:如果两个不同的输入串,通过hash函数/算法得到的值一样,则称这两个串是一个hash碰撞。哈希碰撞通常有2种解决办法:开放定址法和链表法。前者是将所有结点均存放在散列表T[0..m-1]中;后者通常是把散列到同一槽中的所有元素放在一个链表中,而将此链表的头指针放在散列表T[0..m-1]中。

链表法:其实就是上述map.put(k,v)实现原理的第三步的过程。

HashMap中能put两个相同key吗?为什么?

我们在使用hashMap.put()方法的时候知道两个key相同时,value会发生覆盖。因为相同的key,其hashCode一定一样,那么put时会去同一桶链表中寻找,而在源码中put的时候如果key和hashCode都与之前存在的节点一样,那么会用新的value覆盖旧的value,并且put方法返回旧value的值。

那么,要如何实现相同的key存入数据后不被覆盖?

以自定义的类为例,那么在定义类的时候必须重写hashCode和equals,然后创建一个自定义的HashMap类,重写put即可。

像String,已经有重写过hashCode和equals了,就只需要创建一个自定义的hashMap类,重写put。

具体操作推荐一篇博文https://www.cnblogs.com/aflyun/p/10733029.html

HashMap中的键值可以为null吗?原理?

可以。

在HashMap的put方法中会先判断key是否为null,为null则进入putForNullKey(V value)方法 ,然后在talbe[0]链表中查找key为null的元素,如果找到,则将value重新赋值给这个元素的value,并返回原来的value,如果没找到则将这个元素添加到talbe[0]链表的表头。 

其次就是计算key的hash值时,会判断是否为null,如果是,则返回0,即key为null的键值对的hash为0。因此一个hashmap对象只会存储一个key为null的键值对,因为它们的hash值都相同。

HashMap中扩容机制

初始容量:默认为1 << 4(16)。最大容量为1<< 30。扩容加载因子为(0.75f),

第一个临界点在当HashMap中元素的数量等于Map数组长度*加载因子(16*0.75=12),如果超出则按oldThr << 1(原长度*2)扩容。

链表过深问题为什么不用二叉查找树代替,而选择红黑树?为什么不一直使用红黑树?

选择红黑树是为了解决二叉查找树的缺陷,二叉查找树在特殊情况下会变成一条线性结构(这就跟原来使用链表结构一样,会造成很深的问题),遍历查找会非常慢。而红黑树在插入新数据后可能需要通过左旋,右旋、变色这些操作来保持平衡,引入红黑树就是为了查找数据快,解决链表查询深度的问题,我们知道红黑树属于平衡二叉树,但是为了保持“平衡”是需要付出代价的,但是该代价所损耗的资源要比遍历线性链表要少,所以当长度大于8的时候,会使用红黑树,链表长度低于6,就把红黑树转回链表,因为根本不需要引入红黑树,引入反而会慢。

------------------有错误的话欢迎批评指正,一起学习吖

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值