ArrayList和LinkedList的几种循环遍历方式及性能对比分析 (十)

最新推荐文章于 2024-05-09 14:15:16 发布

Wei_Leng

最新推荐文章于 2024-05-09 14:15:16 发布

阅读量1.4k

点赞数

分类专栏： Android性能调优 Android 性能调优和开源代码文章标签： arraylist linkedlist 性能性能测试 iterator

本文链接：https://blog.csdn.net/u014608640/article/details/52513689

版权

Android 性能调优和开源代码同时被 2 个专栏收录

26 篇文章 6 订阅

订阅专栏

Android性能调优

13 篇文章 0 订阅

订阅专栏

Android性能优化系列汇总已完成，包括：

Android 性能优化实例

Android 性能优化之数据库优化(一)

Android 性能优化之布局优化 (二)

Android 性能优化之Java(Android)代码优化 (三)

Android 移动端网络优化 (四)

Android 性能优化系列总篇 (五)

Android性能调优工具TraceView介绍 (六)

Android PreloadDataCache支持预取的数据缓存，使用简单，支持多种缓存算法，支持不同网络类型，扩展性强 (七)

Android 图片SD卡缓存使用简单支持预取支持多种缓存算法支持不同网络类型支持序列化 (八)

Java(Android)线程池（九）

ArrayList和LinkedList的几种循环遍历方式及性能对比分析 (十)

Android HashMap循环遍历方式及其性能对比 (十一)

主要介绍ArrayList和LinkedList这两种list的五种循环遍历方式，各种方式的性能测试对比，根据ArrayList和LinkedList的源码实现分析性能结果，总结结论。
通过本文你可以了解(1)List的五种遍历方式及各自性能 (2)foreach及Iterator的实现 (3)加深对ArrayList和LinkedList实现的了解。
阅读本文前希望你已经了解ArrayList顺序存储和LinkedList链式的结构，本文不对此进行介绍。

相关：HashMap循环遍历方式及其性能对比

1. List的五种遍历方式
下面只是简单介绍各种遍历示例(以ArrayList为例)，各自优劣会在本文后面进行分析给出结论。

(1) for each循环

List<Integer> list = new ArrayList<Integer>();
for (Integer j : list) {
	// use j
}

(2) 显示调用集合迭代器

 
Java
 
        List 
        <Integer> 
         
        list 
         
        = 
         
        new 
         
        ArrayList 
        <Integer> 
        ( 
        ) 
        ; 
       
        for 
         
        ( 
        Iterator 
        <Integer> 
         
        iterator 
         
        = 
         
        list 
        . 
        iterator 
        ( 
        ) 
        ; 
         
        iterator 
        . 
        hasNext 
        ( 
        ) 
        ; 
        ) 
         
        { 
       
        iterator 
        . 
        next 
        ( 
        ) 
        ; 
       
        }

或

List<Integer>list=newArrayList<Integer>();
Iterator<Integer>iterator=list.iterator();
while(iterator.hasNext()){
iterator.next();

(3) 下标递增循环，终止条件为每次调用size()函数比较判断

List<Integer> list = new ArrayList<Integer>();
for (int j = 0; j < list.size(); j++) {
	list.get(j);
}

(4) 下标递增循环，终止条件为和等于size()的临时变量比较判断

List<Integer>list=newArrayList<Integer>();
intsize=list.size();
for(intj=0;j<size;j++){
list.get(j);
}

(5) 下标递减循环

List<Integer>list=newArrayList<Integer>();
for(intj=list.size()-1;j>=0;j--){
list.get(j);
}

在测试前大家可以根据对ArrayList和LinkedList数据结构及Iterator的了解，想想上面五种遍历方式哪个性能更优。

2、List五种遍历方式的性能测试及对比
以下是性能测试代码，会输出不同数量级大小的ArrayList和LinkedList各种遍历方式所花费的时间。

ArrayList和LinkedList循环性能对比测试代码 
   

PS：如果运行报异常in thread “main” java.lang.OutOfMemoryError: Java heap space，请将main函数里面list size的大小减小。

其中getArrayLists函数会返回不同size的ArrayList，getLinkedLists函数会返回不同size的LinkedList。
loopListCompare函数会分别用上面的遍历方式1-5去遍历每一个list数组(包含不同大小list)中的list。
print开头函数为输出辅助函数。

测试环境为Windows7 32位系统 3.2G双核CPU 4G内存，Java 7，Eclipse -Xms512m -Xmx512m
最终测试结果如下：

compare loop performance of ArrayList
-----------------------------------------------------------------------
list size              | 10,000    | 100,000   | 1,000,000 | 10,000,000 
-----------------------------------------------------------------------
for each               | 1 ms      | 3 ms      | 14 ms     | 152 ms    
-----------------------------------------------------------------------
for iterator           | 0 ms      | 1 ms      | 12 ms     | 114 ms    
-----------------------------------------------------------------------
for list.size()        | 1 ms      | 1 ms      | 13 ms     | 128 ms    
-----------------------------------------------------------------------
for size = list.size() | 0 ms      | 0 ms      | 6 ms      | 62 ms     
-----------------------------------------------------------------------
for j--                | 0 ms      | 1 ms      | 6 ms      | 63 ms     
-----------------------------------------------------------------------
 
compare loop performance of LinkedList
-----------------------------------------------------------------------
list size              | 100       | 1,000     | 10,000    | 100,000   
-----------------------------------------------------------------------
for each               | 0 ms      | 1 ms      | 1 ms      | 2 ms      
-----------------------------------------------------------------------
for iterator           | 0 ms      | 0 ms      | 0 ms      | 2 ms      
-----------------------------------------------------------------------
for list.size()        | 0 ms      | 1 ms      | 73 ms     | 7972 ms   
-----------------------------------------------------------------------
for size = list.size() | 0 ms      | 0 ms      | 67 ms     | 8216 ms   
-----------------------------------------------------------------------
for j--                | 0 ms      | 1 ms      | 67 ms     | 8277 ms

第一张表为ArrayList对比结果，第二张表为LinkedList对比结果。

表横向为同一遍历方式不同大小list遍历的时间消耗，纵向为同一list不同遍历方式遍历的时间消耗。
PS：由于首次遍历List会稍微多耗时一点，for each的结果稍微有点偏差，将测试代码中的几个Type顺序调换会发现，for each耗时和for iterator接近。

3、遍历方式性能测试结果分析
(1) foreach介绍
foreach是Java SE5.0引入的功能很强的循环结构，for (Integer j : list)应读作for each int in list。
for (Integer j : list)实现几乎等价于

Iterator<Integer> iterator = list.iterator();
while(iterator.hasNext()) {
	Integer j = iterator.next();
}

下面的分析会将foreach和显示调用集合迭代器两种遍历方式归类为Iterator方式，其他三种称为get方式遍历。

这时我们已经发现foreach的一大好处，简单一行实现了四行的功能，使得代码简洁美观，另一大好处是相对于下标循环而言的，foreach不必关心下标初始值和终止值及越界等，所以不易出错。Effective-Java中推荐使用此种写法遍历，本文会验证这个说法。

使用foreach结构的类对象必须实现了Iterable接口，Java的Collection继承自此接口，List实现了Collection，这个接口仅包含一个函数，源码如下：

package java.lang;
 
import java.util.Iterator;
 
/**
 * Implementing this interface allows an object to be the target of
 * the "foreach" statement.
 *
 * @param <T> the type of elements returned by the iterator
 *
 * @since 1.5
 */
public interface Iterable<T> {
 
    /**
     * Returns an iterator over a set of elements of type T.
     *
     * @return an Iterator.
     */
    Iterator<T> iterator();
}

iterator()用于返回一个Iterator，从foreach的等价实现中我们可以看到，会调用这个函数得到Iterator，再通过Iterator的next()得到下一个元素，hasNext()判断是否还有更多元素。Iterator源码如下：

public interface Iterator<E> {
    boolean hasNext();
 
    E next();
 
    void remove();
}

(2) ArrayList遍历方式结果分析

compare loop performance of ArrayList
-----------------------------------------------------------------------
list size              | 10,000    | 100,000   | 1,000,000 | 10,000,000 
-----------------------------------------------------------------------
for each               | 1 ms      | 3 ms      | 14 ms     | 152 ms    
-----------------------------------------------------------------------
for iterator           | 0 ms      | 1 ms      | 12 ms     | 114 ms    
-----------------------------------------------------------------------
for list.size()        | 1 ms      | 1 ms      | 13 ms     | 128 ms    
-----------------------------------------------------------------------
for size = list.size() | 0 ms      | 0 ms      | 6 ms      | 62 ms     
-----------------------------------------------------------------------
for j--                | 0 ms      | 1 ms      | 6 ms      | 63 ms

PS：由于首次遍历List会稍微多耗时一点，for each的结果稍微有点偏差，将测试代码中的几个Type顺序调换会发现，for each耗时和for iterator接近。

从上面我们可以看出：
a. 在ArrayList大小为十万之前，五种遍历方式时间消耗几乎一样
b. 在十万以后，第四、五种遍历方式快于前三种，get方式优于Iterator方式，并且

int size = list.size();
for (int j = 0; j < size; j++) {
	list.get(j);
}

用临时变量size取代list.size()性能更优。我们看看ArrayList中迭代器Iterator和get方法的实现

private class Itr implements Iterator<E> {
	int cursor;       // index of next element to return
	int lastRet = -1; // index of last element returned; -1 if no such
	int expectedModCount = modCount;
 
	public boolean hasNext() {
		return cursor != size;
	}
 
	@SuppressWarnings("unchecked")
	public E next() {
		checkForComodification();
		int i = cursor;
		if (i >= size)
			throw new NoSuchElementException();
		Object[] elementData = ArrayList.this.elementData;
		if (i >= elementData.length)
			throw new ConcurrentModificationException();
		cursor = i + 1;
		return (E) elementData[lastRet = i];
	}
	……
}
 
public E get(int index) {
	rangeCheck(index);
 
	return elementData(index);
}

从中可以看出get和Iterator的next函数同样通过直接定位数据获取元素，只是多了几个判断而已。

c . 从上可以看出即便在千万大小的ArrayList中，几种遍历方式相差也不过50ms左右，且在常用的十万左右时间几乎相等，考虑foreach的优点，我们大可选用foreach这种简便方式进行遍历。

(3) LinkedList遍历方式结果分析

compare loop performance of LinkedList
-----------------------------------------------------------------------
list size              | 100       | 1,000     | 10,000    | 100,000   
-----------------------------------------------------------------------
for each               | 0 ms      | 1 ms      | 1 ms      | 2 ms      
-----------------------------------------------------------------------
for iterator           | 0 ms      | 0 ms      | 0 ms      | 2 ms      
-----------------------------------------------------------------------
for list.size()        | 0 ms      | 1 ms      | 73 ms     | 7972 ms   
-----------------------------------------------------------------------
for size = list.size() | 0 ms      | 0 ms      | 67 ms     | 8216 ms   
-----------------------------------------------------------------------
for j--                | 0 ms      | 1 ms      | 67 ms     | 8277 ms   
-----------------------------------------------------------------------

PS：由于首次遍历List会稍微多耗时一点，for each的结果稍微有点偏差，将测试代码中的几个Type顺序调换会发现，for each耗时和for iterator接近。

从上面我们可以看出：
a 在LinkedList大小接近一万时，get方式和Iterator方式就已经差了差不多两个数量级，十万时Iterator方式性能已经远胜于get方式。
我们看看LinkedList中迭代器和get方法的实现

privateclassListItrimplementsListIterator<E>{
privateNode<E>lastReturned=null;
privateNode<E>next;
privateintnextIndex;
privateintexpectedModCount=modCount;
 
ListItr(intindex){
// assert isPositionIndex(index);
next=(index==size)?null:node(index);
nextIndex=index;
}
 
publicbooleanhasNext(){
returnnextIndex<size;
}
 
publicEnext(){
checkForComodification();
if(!hasNext())
thrownewNoSuchElementException();
 
lastReturned=next;
next=next.next;
nextIndex++;
returnlastReturned.item;
}
……
}
 
publicEget(intindex){
checkElementIndex(index);
returnnode(index).item;
}
 
/**
* Returns the (non-null) Node at the specified element index.
*/
Node<E>node(intindex){
// assert isElementIndex(index);
 
if(index<(size>>1)){
Node<E>x=first;
for(inti=0;i<index;i++)
x=x.next;
returnx;
}else{
Node<E>x=last;
for(inti=size-1;i>index;i--)
x=x.prev;
returnx;
}
}

从上面代码中可以看出LinkedList迭代器的next函数只是通过next指针快速得到下一个元素并返回。而get方法会从头遍历直到index下标，查找一个元素时间复杂度为哦O(n)，遍历的时间复杂度就达到了O(n2)。

所以对于LinkedList的遍历推荐使用foreach，避免使用get方式遍历。

(4) ArrayList和LinkedList遍历方式结果对比分析
从上面的数量级来看，同样是foreach循环遍历，ArrayList和LinkedList时间差不多，可将本例稍作修改加大list size会发现两者基本在一个数量级上。
但ArrayList get函数直接定位获取的方式时间复杂度为O(1)，而LinkedList的get函数时间复杂度为O(n)。
再结合考虑空间消耗的话，建议首选ArrayList。对于个别插入删除非常多的可以使用LinkedList。

4、结论总结
通过上面的分析我们基本可以总结下：
(1) 无论ArrayList还是LinkedList，遍历建议使用foreach，尤其是数据量较大时LinkedList避免使用get遍历。
(2) List使用首选ArrayList。对于个别插入删除非常多的可以使用LinkedList。
(3) 可能在遍历List循环内部需要使用到下标，这时综合考虑下是使用foreach和自增count还是get方式。