扩容流程
- 计算扩容后新哈希表的长度、阈值
- 扩容
- 如果容量达到最大,即阈值设为最大,不进行扩容
- 没有达到最大,即将新哈希表长度设为旧表长度的2倍
- 初始化扩容
- 扩容
- 将hashmap扩容后的阈值等于计算出来的阈值
- 根据计算出的长度创建新的节点数组,将table指向它
- 如果桶中的结点不为null,且只有一个结点,那么就重新计算索引存入到新数组中
- 如果桶中不止一个结点,且是红黑树类型的结点,那么就调用split方法,进行红黑树的剪枝
- 如果是链表结点,就根据(e.hash & oldCap) == 0判断,将链表中的结点挂在低位链还是高位链上。低位链的索引就是原索引位置,高位链位置是原索引+oldCap(旧容量)
与Jdk1.7不同的是:
(1)rehash方式不同:JDK1.7再哈希是将hash&newCap来重新计算索引的下标的,虽然数组大小扩大了一倍,但是同一个key在新旧哈希表中对应的下标却存在一定联系:要么一致,要么相差一个 oldCap。基于这个结论,那么我们只需要看新下标新增的高位是0或者是1即可。
而JDK1.8通过hash & oldCap来判断新增的高位是0还是1。是0就挂载原索引上,是1就挂在原索引+oldCap上。这样就省去了再哈希的时间。而且同时,由于新增的1bit是0还是1可以认为是随机的,因此resize的过程,均匀的把之前的冲突的节点分散到新的bucket了。这一块就是JDK1.8新增的优化点。
(2)jdk1.7rehash时,将旧链表迁移到新链表,采用的是头插法,如果在新表的数组索引位置相同,则链表元素会倒置。在高并发的情况下回形成环状链表。造成get时的死循环。
jdk1.8时则使用了尾插法,避免了这种问题。至于为什么1.7使用的是头插法,应该是设计者考虑到,后put进来的值更有可能被访问,所以用的是头插法吧。
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
//计算旧哈希表的容量,如果旧的哈希表为空,则长度返回0,否则返回旧哈希表的长度
int oldCap = (oldTab == null) ? 0 : oldTab.length;
//扩容阈值
int oldThr = threshold;
//初始化新表的长度、阈值
int newCap, newThr = 0;
if (oldCap > 0) {
//旧表的长度,如果大于0则代表旧表不为空,即不进行初始化扩容,当容量达到最大的时候,就不在扩容
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
//新哈希表的长度扩容到原来的两倍,阈值页变为原来的两倍
newThr = oldThr << 1; // double threshold
}
else if (oldThr > 0) // initial capacity was placed in threshold
// 能进入到这里,说明oldCap = 0,也就是初始化扩容,此时扩容的大小就应该是oldThr的值
newCap = oldThr;
else {
//以上条件都不满足,则直接采用默认16长度 ,和12阈值
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
//针对上面没有计算扩容阈值的情况
float ft = (float)newCap * loadFactor;
//判断是否小于最大容量
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
//到这里完成了扩容的长度和阈值的计算,现在开始创建新的hash表
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
//将扩容后的哈希表赋值给table
table = newTab;
//如果旧表不为空,即存在数据
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
//将节点设置为空
oldTab[j] = null;
if (e.next == null)
//如果链表只有一个节点,将旧表节点重新计算放入新表
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
//如果该节点是红黑树,执行split方法来处理红黑树节点,包括升级、降级、回退到链表等操作
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
//此时桶中结构为链表,且大于1个节点,开始遍历链表
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
// 从if-else可以看出,对一条链表进行遍历,将链表中的元素通过
// 条件(e.hash & oldCap) == 0来进行分类,满足条件的存放在loHead链上
// 不满足条件的存放在hiHead链上,且都是尾部插入方式,这和JDK7的头部插入有区别
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
//将loHead链放在数组的原位置
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
//将hiHead链放在数组的(j + oldCap)位置
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}