扩容 resize()
扩容机制
当HashMap中的元素个数超过数组大小(数组长度) * loadFactor(负载因子)时,就会进行数组扩容,loadFactor的默认值(DEFAULT_LOAD_FACTOR)是0.75,这是一个折中的取值。也就是说,默认情况下,数组大小为16,那么当HashMap中的元素个数超过16×0.75=12(这个值就是阈值或者边界值threshold值)的时候,就把数组的大小扩展为2×16=32,即扩大一倍,然后重新计算每个元素在数组中的位置,而这是一个非常耗性能的操作,所以如果我们已经预知HashMap中元素的个数,那么预知元素的个数能够有效的提高HashMap的性能。
当HashMap中的其中一个链表的对象个数如果达到了8个,此时如果数组长度没有达到64,那么HashMap会先扩容解决,如果已经达到了64,那么这个链表会变成红黑树,节点类型由Node变成TreeNode类型。当然,如果映射关系被移除后,下次执行resize方法时判断树的节点个数低于6,也会再把树转换为链表。
HashMap 扩容重新分配位置原理:
在进行扩容的时候,会伴随着一次hash的重新分配,并且会遍历hash表中所有的元素,是非常耗时的,所以在编写程序的时候要尽量避免resize().
而在HashMap在进行扩容的时候,重新计算hash的方式非常的巧妙。因为每次扩容是翻倍操作,也就是原来的容量*2,并且因为计算index值得公式为 (n-1)&hash, hash值不变,影响的只是n的2倍。所以n 的二进制扩容后就是在原来的基础上向左移动了 1为 也就是说 扩容后的 2n-1 的二进制有效位比原来的多一个1 (如:原来n-1的二进制为1111,扩容后则是11111)。所以与相同的hash与计算后,index要么在原来的位置要么是 原来位置+原来的容量值
分析:
结论:
在HashMap进行扩容的时候不需要重新计算hash,只需要看看原来的hash值新增的那个bit是1还是0就可以,如果是0,则索引没变 如果是1则索引变成原来位置+旧容量
源码分析
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table; //当前table
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold; //当前阈值 默认16*0.75 = 12
int newCap, newThr = 0;
if (oldCap > 0) {
// 超过最大值就不再扩充了
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
// 计算新的容量和新的临界值 分别左移 1 位
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; //新的边界值= 旧的边界值 * 2
} else if (oldThr > 0) //map创建后第一次扩容,老阈值赋值给新的数组长度
//oldThr = threshold = this.threshold = tableSizeFor(initialCapacity);
//初始化时计算的这个值就等于容量,并不是容量 * 0.75
newCap = oldThr;
else {
// 直接使用默认值,调用无参构造, oldThr 为0 ,设置默认的容量和阈值
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
// 计算新的resize最大上限
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
// 根据扩容后的参数,创建新的数组并赋值
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
if (oldTab != null) {
for (int j = 0;