java 迭代器_Java中 ( Iterator ) 迭代器 详解 ( JDK8源码 )

Java集合框架的集合类,我们有时候称之为容器。容器的种类有很多种,比如ArrayList、LinkedList、HashSet...,每种容器都有自己的特点,ArrayList底层维护的是一个数组;LinkedList是链表结构的;HashSet依赖的是哈希表,每种容器都有自己特有的数据结构。

因为容器的内部结构不同,很多时候可能不知道该怎样去遍历一个容器中的元素。所以为了使对容器内元素的操作更为简单,Java引入了迭代器模式!

那什么是迭代器呢?

迭代器(Iterator)是一个对象,它的工作就是遍历并选择序列中的对象,它提供了一种访问容器(container)对象中的各个元素,而又不必暴露该对象内部细节的方法。

迭代器是一种设计模式,它是一个对象,它可以遍历并选择序列中的对象,而开发人员不需要了解该序列的底层结构 ( 迭代器把访问逻辑从不同类型的集合类中抽取出来,从而避免向外部暴露集合的内部结构)。

迭代器通常被称为“轻量级”对象,因为创建它的代价小。

Java中的Iterator功能比较简单,并且只能单向移动:

(1) 使用方法iterator()要求容器返回一个Iterator。第一次调用Iterator的next()方法时,它返回序列的第一个元素。注意:iterator()方法是java.lang.Iterable接口,被Collection继承。

(2) 使用next()获得序列中的下一个元素。

(3) 使用hasNext()检查序列中是否还有元素。

(4) 使用remove()将迭代器新返回的元素删除。

只要看看下面这个例子就一清二楚了:

import java.util.*;

public class Muster {

public static void main(String[] args) {

ArrayList list = new ArrayList();

list.add("a");

list.add("b");

list.add("c");

Iterator it = list.iterator();

while(it.hasNext()){

String str = (String) it.next();

System.out.println(str);

}

}

}

结果

a

b

c

可以看到,Iterator可以不用管底层数据具体是怎样存储的,都能够通过next()遍历整个List。

为啥要用Iterator?

若不使用迭代器, 访问代码和集合本身是紧密耦合的,因此无法将访问逻辑从集合类和客户端代码中分离出来。而由于不同的集合会对应不同的遍历方法,所以客户端代码无法复用。在实际应用中如何将上面两个集合整合是相当麻烦的。

而对于Iterator来说,它总是用同一种逻辑来遍历集合,使得客户端自身不需要维护集合的内部结构,所有的内部状态都由Iterator来维护。也就是说,客户端不用直接和集合进行打交道,而是控制Iterator向它发送向前向后的指令,就可以遍历集合。

实现原理

但是,具体是怎么实现的呢?背后机制究竟如何呢?

所有Iterator都最终实现接口Iterator,Iterator接口中包含三个基本方法,next(), hasNext(), remove(),其中对于List的遍历删除只能用Iterator的remove方法;

JDK1.8中java.util.Iterator接口的源码如下:

public interface Iterator {

boolean hasNext();

// JDK1.8的新特性,可以通过default在接口中写个方法的实现

default void remove() {

throw new UnsupportedOperationException("remove");

}

default void forEachRemaining(Consumer super E> action) {

Objects.requireNonNull(action);

while (hasNext())

action.accept(next());

}

}

下面将基于ArrayList的Iterator的实现分析Iterator的原理(基于JDK1.8):

在ArrayList类中有个方法iterator(),此方法将返回一个iterator的实现,这里可以看出实现类叫Itr,通过其它源码可知,此类是AarryList的内部类,即ArryList的Iterator实现在ArrayList内部;

public Iterator iterator() {

return new Itr();

}

这里我们来看看Java里ArrayList中实现类Itr类的源码:

private class Itr implements Iterator {

/**

* 下一个返回的位置

*/

int cursor = 0;

/**

* 当前操作的位置

*/

int lastRet = -1;

/**

* 类似版本号,检查List是否有更新

*/

int expectedModCount = modCount;

public boolean hasNext() { // 判断是否有下一个元素

return cursor != size();

}

public E next() { // 返回下一个元素

checkForComodification();

try {

int i = cursor; // cursor记录的是下一个元素,所以调用next时将返回的是cursor对应的元素

E next = get(i); // 记录需要返回的元素

lastRet = i; // 记录当前元素

cursor = i + 1; // 记录下一个元素

return next;

} catch (IndexOutOfBoundsException e) {

checkForComodification();

throw new NoSuchElementException();

}

}

public void remove() { // 移除元素

if (lastRet < 0)

throw new IllegalStateException();

checkForComodification(); // 检查是否有更改,remove或者add

try {

AbstractList.this.remove(lastRet); // 删除当前元素

if (lastRet < cursor) // 删除了之后指标减1

cursor--;

lastRet = -1;

expectedModCount = modCount; // 保持版本号一致

} catch (IndexOutOfBoundsException e) {

throw new ConcurrentModificationException();

}

}

final void checkForComodification() { // 如果有更改则抛出ConcurrentModificationException异常

if (modCount != expectedModCount)

throw new ConcurrentModificationException();

}

从上面代码中可以看出,对于Iterator的实现中主要有几个变量cursor,lastRest, expectedModCount三个变量,其中cursor将记录下一个位置,lastRet记录当前位置,expectedModCount记录没有修改的List的版本号。

问题:还记得说List中在iterator遍历的时候,不能随便添加和删除元素吗,这是为什么呢?

在iterator遍历的时候抛出异常都是checkForComodification()方法作的,根本原因是modCout和expectedModCount不相等,导致抛出异常

那为啥会不相等呢?

可以看看ArrayList的add和remove方法,

remove方法:

8419995baa3902be33e0fa114e37abce.png

add方法:

c9670c8bfd73649df17cd34d6b8ec0ae.png

从上面的代码中可以看出只要对ArrayList作了添加或删除操作都会增加modCount版本号,这样的意思是在迭代期间,会不断检查modCount和迭代器持有的expectedModCount两者是不是相等,如果不相等就抛出异常了。

这样在迭代器迭代期间不能对ArrayList作任何增删操作,但是可以通过iterator的remove作删除操作,从之前的代码可以看出,在iterator的remove()中有一行代码,expectedModCount = modCount; 这个赋值操作保证了iterator的remove是可用性的。

当然,iterator期间不能增删的根本原因是ArrayList遍历会不准,就像遍历数组的时候改变了数组的长度一样

弱一致性迭代器请见

使用该机制的主要目的是为了实现ArrayList中的快速失败机制(fail-fast),在Java集合中较大一部分集合是存在快速失败机制的。

快速失败机制产生的条件:当多个线程对Collection进行操作时,若其中某一个线程通过Iterator遍历集合时,该集合的内容被其他线程所改变,则会抛出ConcurrentModificationException异常。

而上面我们说了实现了Iterable接口的类就可以通过Foreach遍历,那是因为foreach要依赖于Iterable接口返回的Iterator对象,所以从本质上来讲,Foreach其实就是在使用迭代器,在使用foreach遍历时对集合的结构进行修改,和在使用Iterator遍历时对集合结构进行修改本质上是一样的。所以同样的也会抛出异常,执行快速失败机制。

注:foreach是JDK1.5新增加的一个循环结构,foreach的出现是为了简化我们遍历集合的行为。

所以要保证在使用Iterator遍历集合的时候不出错误,就应该保证在遍历集合的过程中不会对集合产生结构上的修改。

如么如何解决这种错误呢?解决方法如下:

在遍历的过程中把需要删除的对象保存到一个集合中,等遍历结束之后再调用removeAll()方法来删除,或者使用iter.remove()方法。

以上主要介绍了单线程的解决方法,那么多线程访问容器的过程中抛出ConcurrentModificationException异常的话又该咋办呢?

在JDK1.5版本中引入了线程安全的容器,比如ConcurrentHashMap和CopyOnWriteArrayList等,可以使用这些线程安全的容器来代替非线程安全的容器。

ConcurrentHashMap: https://blog.csdn.net/q5706503/article/details/85171474

在使用迭代器遍历容器的时候对容器的操作放到synchronized代码块中,但是当引用程序并发成都比较高的时候,这会严重影响程序的性能。

for循环与迭代器的比较

每个方法都有不同的语境,因此它们没有绝对的好也没有绝对的坏,因此在效率上各有各的优势:

ArrayList对随机访问比较快,而for循环中使用的get()方法,采用的即是随机访问的方法,因此在ArrayList里for循环快。

LinkedList则是顺序访问比较快,Iterator中的next()方法采用的是顺序访问方法,因此在LinkedList里使用Iterator较快。

不过总的来说,这两种东西的好坏主要还是要依据集合的数据结构不同的判断。

Iterator与ListIterator有什么区别?

Iterator只能正向遍历集合,适用于获取移除元素。ListIerator继承自Iterator,专门针对List,可以从两个方向遍历List,同时支持元素的修改

参考博客 :

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值