主要是由于hashmap的resize方法引起,resize是扩容map大小。
里面个transfer方法,用于将原表中的结点重新hash,并放入到新表相应的index中。
transfer方法如下:
void transfer(Entry[] newTable, boolean rehash) {
int newCapacity = newTable.length;
for (Entry<K,V> e : table) { //依次从旧数组元素下标0开始循环这个旧表
while(null != e) { //循环处理对应数据元素,重新hash,并放入到旧表
Entry<K,V> next = e.next; //先取出下一个元素
if (rehash) {
e.hash = null == e.key ? 0 : hash(e.key);
}
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
}
}
}
这个方法就是将旧表的元素重新hash,然后放入到新表的相应位置中。
而这里高并发会导致元素的互相指向,形成闭环,如:3<->7。
下面具体分析这种情况:假设当前容器大小为2,threshold为1(实际情况中不会这么设,会导致查找慢)。hash采用最简单的mod,因此3和7这两个key映射在table的下标为1的位置。
而为了解决冲突,采用链式来解决,即数组table第二个元素(下标为1)存储了3->7。(即3结点中的next指向了7)
这时假设需要插入key 8,由于达到扩容条件(即当前元素>=threshold*容器大小=2),这时扩容后大小为4(原先table大小*2)
因此进行扩容:
线程一,执行上述transfer代码:
线程一:
void transfer(Entry[] newTable, boolean rehash) {
int newCapacity = newTable.length;
for (Entry<K,V> e : table) {
while(null != e) {
Entry<K,V> next = e.next;
//线程一在这里休眠
if (rehash) {
e.hash = null == e.key ? 0 : hash(e.key);
}
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
}
}
}
这时,线程1线程栈中,e为3,next值为7
然后,线程2执行上述代码,最终将结点3,结点7放入新表中,即: 7和3在table下标为3中,7->3
在这个过程中,线程2修改了引用结点7,使其中的next字段指向了3(这就是引起闭环的主要原因)
接着线程一继续执行,当前e为3,next为7
第一步,将当前处理的结点3放入新表newTable(下标为3),然后将结点3的next指向null(因此newTable是处于线程栈中,是线程私有的,并不受线程2影响)
这部处理完后,newTable下标为3的内容为:3(其next指向null)
第二步,处理结点7,这时当前结点e为7,而next由于线程2修改了其引用,所以next为3。
这步处理完后,其newTable下标为3的内容为:7(指向3),3(指向null)
第三步,这步是引起闭环的最终原因,当前处理结点为3,next值为null
这时使3指向newTable中的7,然后将3存入newTable
这步处理完后,newTable下标为3的内容为:
3(指向7),7(指向3)。
查找时,查找key为11的值,这时查找table下标为3的内容,先找3,不匹配,然后找7.也不对,这时查7指向的3.。。。。
死循环