hashMap数据结构
hashMap采用数组+链表的存储方式,数组的每个元素存储的是一个Node节点,该节点是一个静态内部类,有4个属性,如图:
- hash :用于存储hash算法计算出来的hash值,该结果需要参与数组下标的计算(下面会介绍)
- key : 程序put的Key值
- value:程序put的Value值
- next:记录链表的下一个节点指向
数组在hashMap类中已声明,这里顺便介绍一下其他常量:
transient Node<K,V>[] table; // Node数组
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // hashMap默认的初始容量为16
static final int MAXIMUM_CAPACITY = 1 << 30; // 最大的容量 2^30
static final float DEFAULT_LOAD_FACTOR = 0.75f; // 负载因子(当存储的数量达到容量X该值的结果,则进行扩容)
static final int TREEIFY_THRESHOLD = 8; // 从jdk1.8开始,当链表长度达到8时,则将链表转为红黑树
static final int UNTREEIFY_THRESHOLD = 6; // 与上面相反,当红黑树的元素个数减少到6时,将红黑树转为链表
草图:
put方法到底做了什么?
源码所示
这里有个hash(key)方法,这个方法就是计算hash值的方法,继续点进去
这里为什么要将计算出来的hash值右移16位然后与原hash值做异或运算呢?因为object的hashCode()方法计算出来的是一个32位的整型,如果将该值向右移动16位,然后再与原hash值做运算,就相当于将该整型的高16位与低16位进行异或运算,这样就可以使得每一位都能参与运算,使得结果值更加随机,这就是所谓的Hash算法
putVal方法
源码如图:
分析:
- 初始化数组
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
这是第一次添加时,table为空,则需要初始化,继续查看resize()方法,resize方法的用途除了初始化还有2倍扩容的功能,由于源码比较繁琐,鄙人只截取相关代码大概说一下流程:
-
获取原来数组的容量和临界值:当原容量大于0,①.如果原来的容量已达到最大值,则不进行扩容,直接将其返回;②.如果没有达到最大值并且原容量大于等于默认值(16),则将旧的临界值扩大2倍作为新的临界值
-
在原容量等于0的情况下,如果原临界值大于0(如果使用无参的构造函数,该值为16),则将扩容后数组的初始容量设置为原临界值,否则,新的容量为16(默认),新的临界值为12(默认),这也是第一次put的时候程序进行的操作,
-
将临界值更新,看吧这里可能说的不太清楚,上图看吧
-
进行扩容
由于是2倍扩容且容量是2^n,所以源码在这用了一个非常巧妙的方法,叹为观止啊,不多BB,来看看,
假设原来的容量为16,hash值的二进制表示1001110100100011000111100100001,则原来下标为2 :
扩容后容量为32, 此时由于hash值的倒数第五位是0,则源码中的(e.hash & oldCap) == 0 成立(注意此时的oldCap还是为16),这就意味着,(32-1)的二进制与hash值进行与运算的结果还是2(与原来下标相同)。如图:
如果倒数第五位是1,则扩容后计算的结果是18(10010),也就是 新的下标 = 原来下标+原容量,不需要用与运算的方法重新计算下标位置了
- 计算数组对应下标的值
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
这里的(n-1 & hash)是很巧妙的,n是Node数组的长度,hash是用上面的hash算法计算出来的hash值,假如此时计算出来的hash值的二进制表示10011101001000110001111001000010 为设数组的长度是16,则n-1=15,则(n-1&hash)
则数组下标为2,(这里为啥不用随机数呢,因为随机数不能保证数组的每个位置都能较好的利用到),同时,这里也可以看出,map的容量大小应为2^n, 假设容量不为2的正数次幂,就不能保证与运算的结果很好的随机,因为n-1的结果“1”串中会含有“0”,导致同hash与运算的结果受到影响,这么说吧,我辛辛苦苦计算出雨露均沾的hash值,你这一进行与运算,又给我弄的不受我hash值控制,我很难受啊!!
- 添加值
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p; // 如果键值对已存在,在代替旧的值,并且最终会将该旧的值返回
else if (p instanceof TreeNode)
// 如果手机红黑树的存储方式,则进行相关操作,PS:鄙人看的有点懵逼,不想看了!23333333
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
// 追加链表
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// 链表长度到达8时,转红黑树
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
// 存在则替代,返回旧的值
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
暂时写到这,鄙人也刚开始学,望批评指正,共勉。。。。