前言
HashMap相关知识点
1. HashMap的数据结构
JDK1.7之前:数组+链表
JDK1.8之后:数组+链表+红黑树
1.7在扩容时使用头插法,存在死链问题
1.8在扩容时改为尾插法,但当多线程访问同一个链表时依旧是线程不安全的
2. 什么时候会发生扩容?
- 当数组中被使用的空间大于threshold(负载因子*容量)
if (++size > threshold)
resize();
- 当数组某一个桶内的链表节点数大于8,且数组容量小于64
添加节点时,当链表节点数大于8时,触发treeifyBin方法,方法内判断数组小于64则进行扩容而不转为红黑树
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
final void treeifyBin(Node<K,V>[] tab, int hash) {
int n, index; Node<K,V> e;
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
resize();
...
3. 什么时候链表会转为红黑树?
当数组容量大于64且,数组桶中某链表节点个数大于8时链表会转化为红黑树,当节点个数小于6则再次转换为链表。
8和6是根据泊松分布以及性能上的考虑确定的,链表节点数超过8的概率已经很低了。
* factorial(k)). The first values are:
*
* 0: 0.60653066
* 1: 0.30326533
* 2: 0.07581633
* 3: 0.01263606
* 4: 0.00157952
* 5: 0.00015795
* 6: 0.00001316
* 7: 0.00000094
* 8: 0.00000006
* more: less than 1 in ten million
4. Hash值的计算
Hash值的计算是通过调用hashCode本地方法获得32位的hash码,再将该hash值的高16位于低16位做异或操作,避免有些hash值 高位变化 和 低位变化小, 结合高低位,降低hash碰撞
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
5. 容量设置
在计算Hash桶位置时 使用hash&(length-1),因为按位与hash&(length-1) 的性能比hash%length 高
若length不是2的n次幂的时候,则计算结果会出现多次重复
若length是2的n次幂,则hash%length==hash&(length-1)
为了拥有按位与的性能,又需要获得取余功能,所以在hashmap中规定数组大小必须是2的n次幂
若创建hashmap输入的数字不是2的n次幂,则再源码中,会进行无符号右移和按位或操作,将容量变为大于等于输入数字的2的n次幂
/**
* Returns a power of two size for the given target capacity.
*/
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}