java面试之hashMap（一）

最新推荐文章于 2024-09-16 10:28:26 发布

良良小迷糊

最新推荐文章于 2024-09-16 10:28:26 发布

阅读量726

点赞数

分类专栏： java面试系列文章标签： java hashmap

本文链接：https://blog.csdn.net/qq_36603538/article/details/106753538

版权

java面试系列专栏收录该内容

2 篇文章 0 订阅

订阅专栏

讲解HashMap前，先看这么一个问题：

问：为什么HashMap作为开篇之作呢？

原因很简单，以前我们在面试的时候，经常被问起HashMap，相信99%的读者们也应该都知道HashMap，基本都会用HashMap，但是里面的蕴含的知识点远远不止put和get那么简单。本次的连载文章希望对于读者有所帮助。

。。。时间过去了半小时。。。

。。。时间又过去了半小时。。。

此时看到这里你是不是觉得HashMap并不是那么简单了，居然可以被面试官N连问这么久。HashMap的实现涉及到Java内存模型问题、线程可见与不可见问题，Hash计算问题、链表结构、二进制、&，|，<<，>>等等一系列问题，所以一个HashMap就能考验一个人的技术功底了。

正文开始

1、HashMap几大概念介绍？

变量	术语	说明
size	大小	HashMap的存储大小
threshould	临界值	HashMap大小达到临界值，需要重新分配大小
loadFactor	负载因子	HashMap大小负载因子，默认为75%
modCount	统一修改	HashMap被修改或者删除的次数总和
Entry	实体	HashMap存储对象的实际实体，由key,value，hash, next组成

2、HashMap的数据结构和原理？

HashMap由数组和链表组合构成的一种数据结构。数组里面每个地方都存了Key-Value这样的实例，首先判断key是否为null,如果为nul，直接查找Entry[0],如果不是null，先计算key的hashcode，然后经过二次hash，得到Hash值，这里的Hash特征值是一个int值。通过hash值找到对应Entry数组的index，然后找到对应所在链表对Value进行插入、删除、查询等操作。

比如我put（"orange"，"橘子"），我插入了 "orange" 元素，这个时候我们会通过哈希函数计算出插入的位置，假设通过计算出来index是1，则插入结果如下：

3、HashMap为什么需要链表？

数组长度是有限的，在有限的长度里面我们使用哈希，哈希本身就存在概率性，就是 "orange" 和 "orang"我们都去hash有一定的概率会一样（hash碰撞），这个时候就需要链表，可以将同一数据放在同一index中。

static class Node<K, V> implements Map.Entry<K, V>{
    final int hash;
    final K key;
    V value;
    Node<K, V>  next;
    ...
}

如上Node源码所示，每个节点保存自身的Hash、key、value、以及下个节点。

4、新的Entry节点是怎么插入链表的？

Java 8之前都是头插法。新来的值会取代原有的值，原来在数组中的值，就顺推至链表中了。

Java8之后就是尾部插入了。新来的值会直接顺着链表来到链表的尾部。

为什么改为尾插法可能有的橘友就觉得这并没有什么用，真的是这样的嘛？当然不是了。

因为在HashMap中有扩容机制。HashMap中数组的数量是有限的，数据如果多次插入，到达了其上限就需要扩容了，也就是resize。那么问题又来了，什么时候resize呢？

5、HashMap是如何进行resize的？

不急，我们先看一下HashMap的源码。

/**
 2      * Constructs an empty <tt>HashMap</tt> with the specified initial
 3      * capacity and load factor.
 4      *
 5      * @param  initialCapacity the initial capacity
 6      * @param  loadFactor      the load factor
 7      * @throws IllegalArgumentException if the initial capacity is negative
 8      *         or the load factor is nonpositive
 9      */
10     public HashMap(int initialCapacity, float loadFactor) {
11         if (initialCapacity < 0)
12             throw new IllegalArgumentException("Illegal initial capacity: " +
13                                                initialCapacity);
14         if (initialCapacity > MAXIMUM_CAPACITY)
15             initialCapacity = MAXIMUM_CAPACITY;
16         if (loadFactor <= 0 || Float.isNaN(loadFactor))
17             throw new IllegalArgumentException("Illegal load factor: " +
18                                                loadFactor);
19         this.loadFactor = loadFactor;
20         this.threshold = tableSizeFor(initialCapacity);
21     }

由上可知，决定resize的因素有两个：

initialCapacity：HashMap的初始化容量，从源码中可知map的最大容量是1<<30,也就是1左移30位，每左移一位乘以2，所以就是1*2^30=1073741824。
loadFactor：负载因子，要大于0，且是非无穷大的数字，默认值为0.75f。

就比如当前的容量大小为100，当你存第76个的时候，判断发现需要进行resize了。

6、HashMap是怎么扩容的？

扩容：创建一个新的Entry空数组，长度原数组的2倍。
ReHash：遍历Entry数组，将之前的所有的Entry重新通过hash算法放入到新的数组中。

第二步中需要重新hash，hash公式如下：

index=HashCode(Key)&(Length-1)

由此可知，原来的长度（Length）假设为8，那么新的长度为16进行位运算，结果显而易见是不一样的。

7、Java8为何改为尾部插入？

假设我们继续使用头插法来使用resize的赋值方式，单链表的头插入方式，同一位置上新元素总会被放在链表的头部位置，在旧数组中同一条Entry链上的元素，通过重新计算索引位置后，有可能被放到了新数组的不同位置上，但是我们的链表还没有断开，这就导致下面这种情况：

如果我们这个时候去取值，就出现了一个问题，无限循环。而细心的你当看源码这块在Java 8之后链表有红黑树部分，代码中多了很多分支判断。

将原本O(n)降到了O(logn)。

对于HashMap的红黑树，是在链表的大小超过8个的时候，自动转化为红黑树，但我们删除其中的链表到6个的时候，又会转换成链表。那为什么这个链表的长度设置为8呢？因为根据泊松分布，在负载因子为0.75时，这个时候链表出现8个的概率会很小很小，所以把7作为分水岭大于7个就由链表转红黑树，小于7个就由红黑树转链表。

头插法会改变链表的上的顺序，但是如果使用尾插，在扩容时会保持链表元素原本的顺序，就不会出现链表成环的问题了。