java面试之hashMap(一)

讲解HashMap前,先看这么一个问题:

问:为什么HashMap作为开篇之作呢?

    原因很简单,以前我们在面试的时候,经常被问起HashMap,相信99%的读者们也应该都知道HashMap,基本都会用HashMap,但是里面的蕴含的知识点远远不止put和get那么简单。本次的连载文章希望对于读者有所帮助。

 

 。。。时间过去了半小时。。。

 

 。。。时间又过去了半小时。。。

 

    此时看到这里你是不是觉得HashMap并不是那么简单了,居然可以被面试官N连问这么久。HashMap的实现涉及到Java内存模型问题、线程可见与不可见问题,Hash计算问题、链表结构、二进制、&,|,<<,>>等等一系列问题,所以一个HashMap就能考验一个人的技术功底了。

 

正文开始 


1、HashMap几大概念介绍?

变量术语说明
size大小HashMap的存储大小
threshould临界值HashMap大小达到临界值,需要重新分配大小
loadFactor负载因子HashMap大小负载因子,默认为75%
modCount统一修改HashMap被修改或者删除的次数总和
Entry实体HashMap存储对象的实际实体,由key,value,hash, next组成

 

2、HashMap的数据结构和原理?

    HashMap由数组和链表组合构成的一种数据结构。数组里面每个地方都存了Key-Value这样的实例,首先判断key是否为null,如果为nul,直接查找Entry[0],如果不是null,先计算key的hashcode,然后经过二次hash,得到Hash值,这里的Hash特征值是一个int值。通过hash值找到对应Entry数组的index,然后找到对应所在链表对Value进行插入、删除、查询等操作。

    比如我put("orange","橘子"),我插入了 "orange" 元素,这个时候我们会通过哈希函数计算出插入的位置,假设通过计算出来index是1,则插入结果如下:

 

3、HashMap为什么需要链表?

    数组长度是有限的,在有限的长度里面我们使用哈希,哈希本身就存在概率性,就是 "orange" 和 "orang"我们都去hash有一定的概率会一样(hash碰撞),这个时候就需要链表,可以将同一数据放在同一index中。

static class Node<K, V> implements Map.Entry<K, V>{
    final int hash;
    final K key;
    V value;
    Node<K, V>  next;
    ...
}

    如上Node源码所示,每个节点保存自身的Hash、key、value、以及下个节点。

4、新的Entry节点是怎么插入链表的?

    

    Java 8之前都是头插法。新来的值会取代原有的值,原来在数组中的值,就顺推至链表中了 。

     Java8之后就是尾部插入了。新来的值会直接顺着链表来到链表的尾部。

    

    为什么改为尾插法可能有的橘友就觉得这并没有什么用,真的是这样的嘛?当然不是了。

    因为在HashMap中有扩容机制。HashMap中数组的数量是有限的,数据如果多次插入,到达了其上限就需要扩容了,也就是resize。那么问题又来了,什么时候resize呢?

5、HashMap是如何进行resize的?

     不急,我们先看一下HashMap的源码。

/**
 2      * Constructs an empty <tt>HashMap</tt> with the specified initial
 3      * capacity and load factor.
 4      *
 5      * @param  initialCapacity the initial capacity
 6      * @param  loadFactor      the load factor
 7      * @throws IllegalArgumentException if the initial capacity is negative
 8      *         or the load factor is nonpositive
 9      */
10     public HashMap(int initialCapacity, float loadFactor) {
11         if (initialCapacity < 0)
12             throw new IllegalArgumentException("Illegal initial capacity: " +
13                                                initialCapacity);
14         if (initialCapacity > MAXIMUM_CAPACITY)
15             initialCapacity = MAXIMUM_CAPACITY;
16         if (loadFactor <= 0 || Float.isNaN(loadFactor))
17             throw new IllegalArgumentException("Illegal load factor: " +
18                                                loadFactor);
19         this.loadFactor = loadFactor;
20         this.threshold = tableSizeFor(initialCapacity);
21     }

 

 由上可知,决定resize的因素有两个:

  • initialCapacity:HashMap的初始化容量,从源码中可知map的最大容量是1<<30,也就是1左移30位,每左移一位乘以2,所以就是1*2^30=1073741824。

  • loadFactor:负载因子,要大于0,且是非无穷大的数字,默认值为0.75f。

       就比如当前的容量大小为100,当你存第76个的时候,判断 发现需要进行resize了。

6、HashMap是怎么扩容的?

  • 扩容:创建一个新的Entry空数组,长度原数组的2倍。

  • ReHash:遍历Entry数组,将之前的所有的Entry重新通过hash算法放入到新的数组中。

    第二步中需要重新hash,hash公式如下:

       index=HashCode(Key)&(Length-1)

    由此可知,原来的长度(Length)假设为8,那么新的长度为16进行位运算,结果显而易见是不一样的。

 

7、Java8为何改为尾部插入?

   假设我们继续使用头插法来使用resize的赋值方式,单链表的头插入方式,同一位置上新元素总会被放在链表的头部位置,在旧数组中同一条Entry链上的元素,通过重新计算索引位置后,有可能被放到了新数组的不同位置上,但是我们的链表还没有断开,这就导致下面这种情况:

    如果我们这个时候去取值,就出现了一个问题,无限循环 。 而细心的你当看源码这块在Java  8之后链表有红黑树部分,代码中多了很多分支判断。

将原本O(n)降到了O(logn)。   

    对于HashMap的红黑树,是在链表的大小超过8个的时候,自动转化为红黑树,但我们删除其中的链表到6个的时候,又会转换成链表。那为什么这个链表的长度设置为8呢?因为根据泊松分布,在负载因子为0.75时,这个时候链表出现8个的概率会很小很小,所以把7作为分水岭大于7个就由链表转红黑树,小于7个就由红黑树转链表。

    头插法会改变链表的上的顺序,但是如果使用尾插,在扩容时会保持链表元素原本的顺序,就不会出现链表成环的问题了。

    Java7在多线程操作HashMap时可能引起死循环,原因是扩容转移后前后链表顺序倒置,在转移过程中修改了原来链表中节点的引用关系。

    Java8在同样的前提下并不会引起死循环,原因是扩容转移后前后链表顺序不变,保持之前节点的引用关系。

    喜欢的朋友可以WX关注公众号。

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值