目录
一、HashMap中的一些静态成员变量
1、DEFAULT_INITIAL_CAPACITY
表示HashMap底层数组的默认容量是1 << 4,即2^4=16。
2、MAXIMUM_CAPACITY
表示HashMap底层数组的最大容量是1 << 30,即2^30。
3、DEFAULT_LOAD_FACTOR
表示HashMap的默认负载因子的值是0.75。
4、TREEIFY_THRESHOLD
表示底层数组中的链表树化的条件之一:链表中至少有8个节点。
5、UNTREEIFY_THRESHOLD
表示底层数组中的红黑树解树化的条件:树中节点少于6个的时候退化成链表。
6、MIN_TREEIFY_CAPACITY
表示底层数组中的链表树化的条件之一:底层数组的容量至少为64。
二、HashMap中的构造方法
1、HashMap()
无参的构造方法仅仅指定了负载因子的大小为默认的0.75,并没有初始化底层数组的容量,所以当我们调用无参的构造方法构造一个HashMap,此时底层的数组为NULL,容量为0。
2、HashMap(int)
带有一个参数的构造方法可以用来指定底层数组的初始容量,但实际上调用的是下面带有2个参数的构造方法↓
3、HashMap(int,float)
构造一个底层数组初始容量为initialCapacity, 负载因子为loadFactor的HashMap,如果initialCapacity小于0或loadFactor小于等于0,就会抛出一个IllegalArgumentException异常,如果initialCapacity大于2^30,则初始容量为2^30。
继续追踪tableSizeFor(initialCapacity),看一下数组的初始容量会被设置为多少:
tableSizeFor(int cup)方法会将我们传进来的initialCapacity经过一系列位运算,最后的返回值我们可以看最上面的那一行注释,它最后会返回一个最接近initialCapacity并且大于initialCapacity的2的次方的数,举个栗子,如果给定的initialCapacity是10,那么会返回16;如果initialCapacity是25,那么会返回32……
那么问题来了,为什么要这样做呢?为什么不直接initialCapacity返回呢?
这样做是为了在put方法中更快速地计算数组下标。
4、HashMap(Map<? extends K, ? extends V>)
这个构造方法会把传进来的Map构造为一个新的HashMap,映射关系与原来的Map相同,底层数组使用默认负载因子(0.75)和足够容纳指定Map中的映射的初始容量创建。
三、HashMap中的put方法
我们来看一下源码中是如何建立key-vauel映射关系的:
它会首先计算key的哈希值,然后将哈希值,key,value传入putVal方法中。
追踪putVal方法:
内容有点多,我们逐条来看:
1、初始化底层数组为空的数组容量
第一行定义了一个Node<K,V>类型的tab数组,p节点,和两个整型变量n、i。
然后让tab指向底层数组table,判断tab是否为空,或者容量是否为0,满足以上条件之一,就会调用resize()方法对数组进行初始化容量的操作,然后再计算数组的长度。
刚才无参的构造方法并没有初始化底层数组,那么我们追踪一下resize()方法,看一下最后会将底层数组的容量初始为多少。
追踪resize方法:
也就是说,如果调用无参的构造方法后,第一次进行put操作时,会将底层的数组容量初始为默认的容量:16
2、插入元素
2.1 当前数组下标为空
源码中计算当前key在数组中所属的下标是通过:(n - 1) & hash的方法,而不是用hash % 数组长度,它这样计算有什么好处呢?
刚才分析构造方法时,我们知道,底层数组初始容量都是2的次幂,而2的次幂减1后的值,它的二进制的有效位全为1,在进行位运算时速度会更快一点,这也就是大佬们为什么在初始化数组时,初始容量给定为一个2的次幂数的原因吧~
找到key所属下标之后,下标如果为空,那么直接将元素插入即可。
2.2 当前数组下标不为空
3、数组扩容
如果当前元素插入成功后,数组中的有效元素数量超过阈值,即插入该元素后负载因子会超标,就会再次调用resize方法进行扩容。