目录
一、概述
首先HashMap是Map的一个实现类,而Map存储形式是(key,value)键值对。而Map的本质就是一个链表数组。如下是HashMap的结构图。
二、源码分析
HashMap中计算数组下标是HashMap的核心算法,首先,想要读懂hashMap源码,需要掌握二进制算法,右移运算符>>> ,异或运算符^ ,&与运算符的用法。下面开始解读吧。
1)hashMap中的hash值如何计算?
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
public int hashCode() {
int h = hash;
if (h == 0 && value.length > 0) {
char val[] = value;
for (int i = 0; i < value.length; i++) {
h = 31 * h + val[i];
}
hash = h;
}
return h;
}
源代码可以看出,key经过hashCode计算后,再用hashCode返回的值进行右移16位再与hashCode异或计算。
1. h >>> 16 是什么,有什么用?
例子:h是hashcode,假设key="美国" 得到hashcode = 1034543。h >>> 16是用来取出h的高16,这里以正数为例,高位右移16位,高位补0,(>>>是无符号右移) 如下展示:
0000 0000 0000 1111 1100 1001 0010 1111
>>> 16
0000 0000 0000 0000 0000 0000 0000 1111
最终,高16位全部到了低16位。再用得到的值与hashcode 进行异或计算。
0000 0000 0000 1111 1100 1001 0010 1111
^
0000 0000 0000 0000 0000 0000 0000 1111
= 0000 0000 0000 1111 1100 1001 0010 0000
因此(h = key.hashCode()) ^ (h >>> 16)的目的是为了让得到的hash值更加随机,有人问,为什么用^而不用&和|呢? 因为&和|都会使得结果偏向0或者偏向1 ,并不是均匀的概念,所以用^。hashMap最主要的算法其实就是数组下标计算,hash值更随机的目的就是为了能够更均匀分配下标。
2)hashMap中的数组下标如何计算
i=(n - 1) & hash
源码中,i表示下标,n表示数组大小,默认为16,当插入的数据大于16时会进行扩容到32,每次扩容都是2的倍数扩容。
假设n为16,n= 16; (n-1) = 15;转换二进制为1111;使用上面的hash值进行与运算后,如下:
0000 0000 0000 1111 1100 1001 0010 0000
&运算
0000 0000 0000 0000 0000 0000 0000 1111
=0000 0000 0000 0000 0000 0000 0000 0000
上述运算实质是:0000 与 1111 & 运算,最终计算得到下标为0。
由上可以得出一个结论:
当n=8时 下标运算结果取决于哈希值的低三位
当n=16时 下标运算结果取决于哈希值的低四位
当n=32时 下标运算结果取决于哈希值的低五位
当n=2的N次方, 下标运算结果取决于哈希值的低N位。
3)hashMap中链表使用的地方
因为通过随机分配下标的计算会出现重复下标,如果数组下标中已经存在数据,则把重复的数据找出来,进行hash对比。
如果hash值相同,则替换成新值。
如果hash值不同,则把新的值放入新的Node,把新的Node放到重复的Node.next里面,形成链表结构。
三、总结
是不是很简单。