HashMap底层原理解析

最新推荐文章于 2024-08-06 08:05:34 发布

贺兰猪

最新推荐文章于 2024-08-06 08:05:34 发布

阅读量1.5k

点赞数 1

分类专栏： Java

本文链接：https://blog.csdn.net/u013773608/article/details/117218527

版权

Java 专栏收录该内容

16 篇文章 1 订阅

订阅专栏

为了偷懒，部分内容直接copy了。然后附加几个hashMap中比较重要的点。

以下为转载————————————————原文链接：https://blog.csdn.net/qq_43370771/article/details/111353046
常见的数据结构有三种：
1、数组结构：存储区间连续、内存占用严重、空间复杂度大
优点：随机读取和修改效率高，原因是数组是连续的（随机访问性强，查找速度快）
缺点：插入和删除数据效率低，因插入数据，这个位置后面的数据在内存中都要往后移动，且大小固定不易动态扩展。
2、链表结构：存储区间离散、占用内存宽松、空间复杂度小
优点：插入删除速度快，内存利用率高，没有固定大小，扩展灵活
缺点：不能随机查找，每次都是从第一个开始遍历（查询效率低）
3、哈希表结构：结合数组结构和链表结构的优点，从而实现了查询和修改效率高，插入和删除效率也高的一种数据结构
常见的HashMap就是这样的一种数据结构

在这里插入图片描述

HashMap中的put()和get()的实现原理：

1、map.put(k,v)实现原理
（1）首先将k,v封装到Node对象当中（节点）。
（2）然后它的底层会调用K的hashCode()方法得出hash值。
（3）通过哈希表函数/哈希算法，将hash值转换成数组的下标，下标位置上如果没有任何元素，就把Node添加到这个位置上。如果说下标对应的位置上有链表。此时，就会拿着k和链表上每个节点的k进行equal。如果所有的equals方法返回都是false，那么这个新的节点将被添加到链表的末尾。如其中有一个equals返回了true，那么这个节点的value将会被覆盖。
2、map.get(k)实现原理
（1）先调用k的hashCode()方法得出哈希值，并通过哈希算法转换成数组的下标。
（2）通过上一步哈希算法转换成数组的下标之后，在通过数组下标快速定位到某个位置上。如果这个位置上什么都没有，则返回null。如果这个位置上有单向链表，那么它就会拿着K和单向链表上的每一个节点的K进行equals，如果所有equals方法都返回false，则get方法返回null。如果其中一个节点的K和参数K进行equals返回true，那么此时该节点的value就是我们要找的value了，get方法最终返回这个要找的value。

为何随机增删、查询效率都很高的原因是？

原因: 增删是在链表上完成的，而查询只需扫描部分，则效率高。
HashMap集合的key，会先后调用两个方法，hashCode and equals方法，这这两个方法都需要重写。

为什么放在hashMap集合key部分的元素需要重写equals方法？

因为equals方法默认比较的是两个对象的内存地址

HashMap红黑树原理分析

相比 jdk1.7 的 HashMap 而言，jdk1.8最重要的就是引入了红黑树的设计，当hash表的单一链表长度超过 8 个的时候，链表结构就会转为红黑树结构。
为什么要这样设计呢？好处就是避免在最极端的情况下链表变得很长很长，在查询的时候，效率会非常慢。

红黑树查询：其访问性能近似于折半查找，时间复杂度 O(logn)；
链表查询：这种情况下，需要遍历全部元素才行，时间复杂度 O(n)；
简单的说，红黑树是一种近似平衡的二叉查找树，其主要的优点就是“平衡“，即左右子树高度几乎一致，以此来防止树退化为链表，通过这种方式来保障查找的时间复杂度为 log(n)。

以上为转载————————————————原文链接：https://blog.csdn.net/qq_43370771/article/details/111353046

关于红黑树下次开一篇一起学习了解一下，下面讲讲HashMap中常见的几个重要问题。

什么是Hash碰撞？怎么解决？

Hash碰撞：如果两个不同的输入串，通过hash函数／算法得到的值一样，则称这两个串是一个hash碰撞。哈希碰撞通常有2种解决办法：开放定址法和链表法。前者是将所有结点均存放在散列表T[0..m-1]中；后者通常是把散列到同一槽中的所有元素放在一个链表中，而将此链表的头指针放在散列表T[0..m-1]中。

链表法：其实就是上述map.put(k,v)实现原理的第三步的过程。

HashMap中能put两个相同key吗？为什么？

我们在使用hashMap.put()方法的时候知道两个key相同时，value会发生覆盖。因为相同的key，其hashCode一定一样，那么put时会去同一桶链表中寻找，而在源码中put的时候如果key和hashCode都与之前存在的节点一样，那么会用新的value覆盖旧的value,并且put方法返回旧value的值。

那么，要如何实现相同的key存入数据后不被覆盖？

以自定义的类为例，那么在定义类的时候必须重写hashCode和equals，然后创建一个自定义的HashMap类，重写put即可。

像String，已经有重写过hashCode和equals了，就只需要创建一个自定义的hashMap类，重写put。

具体操作推荐一篇博文https://www.cnblogs.com/aflyun/p/10733029.html

HashMap中的键值可以为null吗？原理？

可以。

在HashMap的put方法中会先判断key是否为null，为null则进入putForNullKey(V value)方法，然后在talbe[0]链表中查找key为null的元素，如果找到，则将value重新赋值给这个元素的value，并返回原来的value，如果没找到则将这个元素添加到talbe[0]链表的表头。

其次就是计算key的hash值时，会判断是否为null，如果是，则返回0，即key为null的键值对的hash为0。因此一个hashmap对象只会存储一个key为null的键值对，因为它们的hash值都相同。

HashMap中扩容机制

初始容量：默认为1 << 4（16）。最大容量为1<< 30。扩容加载因子为(0.75f)，

第一个临界点在当HashMap中元素的数量等于Map数组长度*加载因子（16*0.75=12），如果超出则按oldThr << 1（原长度*2）扩容。

链表过深问题为什么不用二叉查找树代替，而选择红黑树？为什么不一直使用红黑树？

选择红黑树是为了解决二叉查找树的缺陷，二叉查找树在特殊情况下会变成一条线性结构（这就跟原来使用链表结构一样，会造成很深的问题），遍历查找会非常慢。而红黑树在插入新数据后可能需要通过左旋，右旋、变色这些操作来保持平衡，引入红黑树就是为了查找数据快，解决链表查询深度的问题，我们知道红黑树属于平衡二叉树，但是为了保持“平衡”是需要付出代价的，但是该代价所损耗的资源要比遍历线性链表要少，所以当长度大于8的时候，会使用红黑树，链表长度低于6，就把红黑树转回链表，因为根本不需要引入红黑树，引入反而会慢。

------------------有错误的话欢迎批评指正，一起学习吖