首先说说现象,当我们使用iterator迭代器遍历一个集合的过程中,如果其它线程,或者它自己向这个集合新增或删除了一个key-value,那么当前线程就会抛出ConcurrentModificationException异常。
然后说说原理。无论是AbstractList,还是HashMap,它们都拥有一个modCount变量,每当我们向集合新增或者删除元素,都会使modCount的值增加1,这个参数就好像集合的操作版本号。当我们在迭代之前,会创建一个expectedModCount,记录了迭代之前的操作版本号,每次迭代获取数据时,都会检查一下,当前的modCount是否与expectedModCount想等,若不相等,则说明在当前线程迭代遍历元素时,有其他的线程操作了集合。
集合包下面的集合都不是线程安全的,都会有并发问题,所以都包含modCount变量。使用fail fast机制,当一个线程在迭代遍历,另一个线程在新增、删除元素时,就会立刻报错。
注意: 一个线程在迭代遍历,另一个线程在修改元素时,并不会触发fail fast。可以看ArrayList和LinkedList的set()源码,没有发现modCount的痕迹(你只要不删除,或者新增元素,就没问题)。
并且,fail fast仅仅是一个错误检测机制,因为JDK并不能保证fail fast一定会发生。若在多线程环境下使用fail-fast机制的集合,建议使用“java.util.concurrent包下的类”去取代“java.util包下的类”。
口说无凭,我们来看看源码。就拿LinkedList来举例,代码如下所示:
LinkedList<String> list = new LinkedList<>();
list.add("123");
list.add("456");
list.add("789");
for (String str : list) {
list.remove();
}
首次执行list.remove()是不会报错的,但是当进入下一轮循环时,就会报错。
当我们使用for循环遍历任何一个List之前,底层都会调用listIterator( )方法,创建一个ListIterator对象,用于遍历。LinkedList也不例外,它重写了listIterator()方法,返回了一个自定义的ListItr对象。
public ListIterator<E> listIterator(int index) {
checkPositionIndex(index);
return new ListItr(index);
}
private class ListItr implements ListIterator<E> {
// 省略..
private int expectedModCount = modCount;
ListItr(int index) {
省略..
}
public E next() {
checkForComodification();
省略..
}
final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
}
我省略了许多与本文无关的代码,关键代码就那么几句。执行listIerator()方法时,一定会创建一个ListItr对象,同时一定会初始化它的成员变量expectedModCount,等于当前的modCount。
接下来就是遍历,遍历无非就是获取List中的下一个元素,用屁股想想,调用的不就是next()方法么,next()方法一上来就执行了checkForComodification(),比较一下当前的modCount是否与expectedModCount一样,如果不一样,就抛出异常。
这个意思不就是在说,如果在遍历List的过程中,你敢做新增或者删除操作(累加了modCount的值),那就会报错。
值得注意的是,报错的地方不是list.remove(),报错的是你做了新增、删除操作后的接下来的一轮遍历时,获取数据时会报错。
---------------------------分割线-------------------------------------------------------
那是不是只要遍历集合时,新增或者删除(或者其它改变modCount的操作),都会报错呢?
不是的,只要你在查询数据的时候,绕开包含了modCount检查的方法,就不会报错。
String str;
while((str = list.peekFirst()) != null) {
System.out.println(str);
list.pop();
}
上面的代码也是在遍历链表,但是不会报错,因为list.pop()没有修改modCount的值,peekFirst()也没有去检查modCount,fail fast不复存在,就不会报错。