迭代器
迭代器(Iterator) 是一种行为型设计模式,属于设计模式之一,迭代器模式提供了一种方法来顺序访问一个聚合对象(如List、Set等)中各个元素,而不需要暴露该对象的内部表示。
-
Iterator
对象称为迭代器,主要用于遍历Collection
集合中的元素。 -
所有实现了Collection接口的集合类都有一个iterator()方法,用以返回一个实现了Iterator接口的对象,即可以返回一个迭代器。
-
Iterator
仅用于遍历集合,Iterator
本身并不存放对象。 -
集合的顶层接口
Collection
继承Iterable
接口。
迭代器的特性
-
fail-fast机制:当集合在迭代过程中被修改(除了通过迭代器自身的
remove()
方法),迭代器会快速失败,抛出ConcurrentModificationException
。 -
fail-safe机制:某些集合(如
CopyOnWriteArrayList
)的迭代器是fail-safe
的,即它们允许在迭代过程中修改集合,但修改会反映在一个新的集合副本上,不会影响迭代器遍历的集合。
Iterable 和 Iterator 接口
Iterable接口
public interface Iterable<T> {
/**
* Returns an iterator over elements of type {@code T}.
*
* @return an Iterator.
*/
Iterator<T> iterator();
}
在 Iterable
接口中有一个 Iterator
方法,它返回一个 Itertator
对象。
Iterator接口
public interface Iterator<E> {
boolean hasNext();
E next();
default void remove() {
throw new UnsupportedOperationException("remove");
}
}
返回值类型 | 方法名 | 功能 | |
---|---|---|---|
boolean | hasNext() | 判断集合是否还有元素,如果返回 true 表示集合还有元素,返回 false 表示集合中没有元素;一般对集合的访问通过 while(hasNext()) 判断是否还需要遍历。 | |
E | next() | 获取集合中遍历的当前元素 ;一般先调用 hasNext() 方法判断是否存在元素,再调用 next() 获取元素,需要进行循环交替遍历集合中的元素。 | |
void | remove | 删除集合中的元素。 |
使用迭代器遍历
Collection col = new ArrayList();
Iterator iterator = col.iterator(); // 创建迭代器对象
// 判断集合是否有下一个元素
while(iterator.hasNext()){
// 指针移动一个位置,返回集合该位置的元素
Object tmp = iterator.next();
}
在调用 next()
方法之前必须要调用 hastNext()
方法进行检测;如果没有调用并且没有下一个元素,直接调用 next()
方法会抛出 NoSuchElementException异常
。
遍历完毕后,若继续调用 iterator.hasNext()
将会报错,若需要继续遍历,可以通过重置迭代器(创建一个新的迭代器或使用可重复迭代器)解决
使用增强 for 循环 遍历
增强for循环 可以代替 Iterator
迭代器 ,可以把它看做简化版的 Iterator
,和迭代器本质一样,它的底层实现就是 Iterator
迭代器,只能用于遍历集合或数组。
for(Object object : col){
// 对 object 进行操作
}
迭代器中的 remove 方法
使用迭代器的 remove 的方法可以删除集合中的元素
在Java集合中,以集合 ArrayList
为例,在使用中可能会遇到删除的需求场景,此时如果代码书写不当,极有可能会抛出java.util.ConcurrentModificationException
异常信息。因为触发了集合中并发修改的异常
在 ArrayList
集合的 Iterator
方法中,是通过返回 Itr
对象来获得迭代器的。Itr
是 ArrayList
的一个内部类,它实现了 Iterator
接口
属性 | 含义 |
---|---|
cursor | 索引下标,表示下一个可以访问的元素的索引,默认值为 0 |
lastRet | 索引下标,表示上一个元素的索引,默认值为 -1 |
expectedModCount | 对集合修改的版本号,初始值为ModCount |
ModCount 定义在 AbstractList
接口中,初始值为0,在对集合进行变更操作(增加、删除、修改等)的时候会对版本号进行 +1 操作。:
protected transient int modCount = 0;
-
在使用迭代器的
remove()
操作时,会将更新后的 modCount 给expectedModCount,两者会得到同步,但是在调用集合的remove()
方法后,两个不会进行同步,进而导致在checkForComodification()
校验时不通过,抛出java.util.ConcurrentModificationException
异常。 -
在单线程下使用迭代器是没有问题的,但是在多线程下同时操作集合就不允许了,可以通过
fail-fast
快速失败机制,快速判断是否存在同时操作问题。因此,集合在多线程下使用是不安全的。
for…each 的陷阱
为什么不能在 foreach
里执行删除操作?
因为 for...each
循环是基于迭代器实现的,而迭代器在遍历集合时会维护一个 expectedModCount
属性来记录集合被修改的次数。
如果在 for...each
循环中执行删除操作会导致 expectedModCount 属性值与实际的 modCount 属性值不一致,从而导致迭代器的 hasNext()
和 next()
方法抛出 ConcurrentModificationException
异常。
为了避免这种情况,应该使用迭代器的 remove() 方法来删除元素,该方法会在删除元素后更新迭代器状态,确保循环的正确性。如果需要在循环中删除元素,应该使用迭代器的 remove() 方法,而不是集合自身的 remove() 方法。
除此之外,还可以采用 Stream流 的 filter()
方法来过滤集合中的元素,然后再通过 collect()
方法将过滤后的元素收集到一个新的集合中。