原文 : http://www.trinea.cn/android/arraylist-linkedlist-loop-performance
主要介绍ArrayList和LinkedList这两种list的五种循环遍历方式,各种方式的性能测试对比,根据ArrayList和LinkedList的源码实现分析性能结果,总结结论。
通过本文你可以了解(1)List的五种遍历方式及各自性能 (2)foreach及Iterator的实现 (3)加深对ArrayList和LinkedList实现的了解。
阅读本文前希望你已经了解ArrayList顺序存储和LinkedList链式的结构,本文不对此进行介绍。
1. List的五种遍历方式
下面只是简单介绍各种遍历示例(以ArrayList为例),各自优劣会在本文后面进行分析给出结论。
(1) for each循环
1
2
3
4
|
List
<Integer>
list
=
new
ArrayList
<Integer>
(
)
;
for
(
Integer
j
:
list
)
{
// use j
}
|
(2) 显示调用集合迭代器
1
2
3
4
|
List
<Integer>
list
=
new
ArrayList
<Integer>
(
)
;
for
(
Iterator
<Integer>
iterator
=
list
.
iterator
(
)
;
iterator
.
hasNext
(
)
;
)
{
iterator
.
next
(
)
;
}
|
或
1
2
3
4
5
|
List
<Integer>
list
=
new
ArrayList
<Integer>
(
)
;
Iterator
<Integer>
iterator
=
list
.
iterator
(
)
;
while
(
iterator
.
hasNext
(
)
)
{
iterator
.
next
(
)
;
}
|
(3) 下标递增循环,终止条件为每次调用size()函数比较判断
1
2
3
4
|
List
<Integer>
list
=
new
ArrayList
<Integer>
(
)
;
for
(
int
j
=
0
;
j
<
list
.
size
(
)
;
j
++
)
{
list
.
get
(
j
)
;
}
|
(4) 下标递增循环,终止条件为和等于size()的临时变量比较判断
1
2
3
4
5
|
List
<Integer>
list
=
new
ArrayList
<Integer>
(
)
;
int
size
=
list
.
size
(
)
;
for
(
int
j
=
0
;
j
<
size
;
j
++
)
{
list
.
get
(
j
)
;
}
|
(5) 下标递减循环
1
2
3
4
|
List
<Integer>
list
=
new
ArrayList
<Integer>
(
)
;
for
(
int
j
=
list
.
size
(
)
-
1
;
j
>=
0
;
j
--
)
{
list
.
get
(
j
)
;
}
|
在测试前大家可以根据对ArrayList和LinkedList数据结构及Iterator的了解,想想上面五种遍历方式哪个性能更优。
2、List五种遍历方式的性能测试及对比
以下是性能测试代码,会输出不同数量级大小的ArrayList和LinkedList各种遍历方式所花费的时间。
PS:如果运行报异常in thread “main” java.lang.OutOfMemoryError: Java heap space,请将main函数里面list size的大小减小。
其中getArrayLists函数会返回不同size的ArrayList,getLinkedLists函数会返回不同size的LinkedList。
loopListCompare函数会分别用上面的遍历方式1-5去遍历每一个list数组(包含不同大小list)中的list。
print开头函数为输出辅助函数。
测试环境为Windows7 32位系统 3.2G双核CPU 4G内存,Java 7,Eclipse -Xms512m -Xmx512m
最终测试结果如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
compare
loop
performance
of
ArrayList
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
list
size
|
10
,
000
|
100
,
000
|
1
,
000
,
000
|
10
,
000
,
000
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
each
|
1
ms
|
3
ms
|
14
ms
|
152
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
iterator
|
0
ms
|
1
ms
|
12
ms
|
114
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
list
.
size
(
)
|
1
ms
|
1
ms
|
13
ms
|
128
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
size
=
list
.
size
(
)
|
0
ms
|
0
ms
|
6
ms
|
62
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
j
--
|
0
ms
|
1
ms
|
6
ms
|
63
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
compare
loop
performance
of
LinkedList
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
list
size
|
100
|
1
,
000
|
10
,
000
|
100
,
000
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
each
|
0
ms
|
1
ms
|
1
ms
|
2
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
iterator
|
0
ms
|
0
ms
|
0
ms
|
2
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
list
.
size
(
)
|
0
ms
|
1
ms
|
73
ms
|
7972
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
size
=
list
.
size
(
)
|
0
ms
|
0
ms
|
67
ms
|
8216
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
j
--
|
0
ms
|
1
ms
|
67
ms
|
8277
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
|
第一张表为ArrayList对比结果,第二张表为LinkedList对比结果。
表横向为同一遍历方式不同大小list遍历的时间消耗,纵向为同一list不同遍历方式遍历的时间消耗。
PS:由于首次遍历List会稍微多耗时一点,for each的结果稍微有点偏差,将测试代码中的几个Type顺序调换会发现,for each耗时和for iterator接近。
3、遍历方式性能测试结果分析
(1) foreach介绍
foreach是Java SE5.0引入的功能很强的循环结构,for (Integer j : list)应读作for each int in list。
for (Integer j : list)实现几乎等价于
1
2
3
4
|
Iterator
<Integer>
iterator
=
list
.
iterator
(
)
;
while
(
iterator
.
hasNext
(
)
)
{
Integer
j
=
iterator
.
next
(
)
;
}
|
下面的分析会将foreach和显示调用集合迭代器两种遍历方式归类为Iterator方式,其他三种称为get方式遍历。
这时我们已经发现foreach的一大好处,简单一行实现了四行的功能,使得代码简洁美观,另一大好处是相对于下标循环而言的,foreach不必关心下标初始值和终止值及越界等,所以不易出错。Effective-Java中推荐使用此种写法遍历,本文会验证这个说法。
使用foreach结构的类对象必须实现了Iterable接口,Java的Collection继承自此接口,List实现了Collection,这个接口仅包含一个函数,源码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
package
java
.
lang
;
import
java
.
util
.
Iterator
;
/**
* Implementing this interface allows an object to be the target of
* the "foreach" statement.
*
* @param <T> the type of elements returned by the iterator
*
* @since 1.5
*/
public
interface
Iterable
<T>
{
/**
* Returns an iterator over a set of elements of type T.
*
* @return an Iterator.
*/
Iterator
<T>
iterator
(
)
;
}
|
iterator()用于返回一个Iterator,从foreach的等价实现中我们可以看到,会调用这个函数得到Iterator,再通过Iterator的next()得到下一个元素,hasNext()判断是否还有更多元素。Iterator源码如下:
1
2
3
4
5
6
7
|
public
interface
Iterator
<E>
{
boolean
hasNext
(
)
;
E
next
(
)
;
void
remove
(
)
;
}
|
(2) ArrayList遍历方式结果分析
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
compare
loop
performance
of
ArrayList
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
list
size
|
10
,
000
|
100
,
000
|
1
,
000
,
000
|
10
,
000
,
000
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
each
|
1
ms
|
3
ms
|
14
ms
|
152
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
iterator
|
0
ms
|
1
ms
|
12
ms
|
114
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
list
.
size
(
)
|
1
ms
|
1
ms
|
13
ms
|
128
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
size
=
list
.
size
(
)
|
0
ms
|
0
ms
|
6
ms
|
62
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
j
--
|
0
ms
|
1
ms
|
6
ms
|
63
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
|
PS:由于首次遍历List会稍微多耗时一点,for each的结果稍微有点偏差,将测试代码中的几个Type顺序调换会发现,for each耗时和for iterator接近。
从上面我们可以看出:
a. 在ArrayList大小为十万之前,五种遍历方式时间消耗几乎一样
b. 在十万以后,第四、五种遍历方式快于前三种,get方式优于Iterator方式,并且
1
2
3
4
|
int
size
=
list
.
size
(
)
;
for
(
int
j
=
0
;
j
<
size
;
j
++
)
{
list
.
get
(
j
)
;
}
|
用临时变量size取代list.size()性能更优。我们看看ArrayList中迭代器Iterator和get方法的实现
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
private
class
Itr
implements
Iterator
<E>
{
int
cursor
;
// index of next element to return
int
lastRet
=
-
1
;
// index of last element returned; -1 if no such
int
expectedModCount
=
modCount
;
public
boolean
hasNext
(
)
{
return
cursor
!=
size
;
}
@SuppressWarnings
(
"unchecked"
)
public
E
next
(
)
{
checkForComodification
(
)
;
int
i
=
cursor
;
if
(
i
>=
size
)
throw
new
NoSuchElementException
(
)
;
Object
[
]
elementData
=
ArrayList
.
this
.
elementData
;
if
(
i
>=
elementData
.
length
)
throw
new
ConcurrentModificationException
(
)
;
cursor
=
i
+
1
;
return
(
E
)
elementData
[
lastRet
=
i
]
;
}
……
}
public
E
get
(
int
index
)
{
rangeCheck
(
index
)
;
return
elementData
(
index
)
;
}
|
从中可以看出get和Iterator的next函数同样通过直接定位数据获取元素,只是多了几个判断而已。
c . 从上可以看出即便在千万大小的ArrayList中,几种遍历方式相差也不过50ms左右,且在常用的十万左右时间几乎相等,考虑foreach的优点,我们大可选用foreach这种简便方式进行遍历。
(3) LinkedList遍历方式结果分析
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
compare
loop
performance
of
LinkedList
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
list
size
|
100
|
1
,
000
|
10
,
000
|
100
,
000
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
each
|
0
ms
|
1
ms
|
1
ms
|
2
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
iterator
|
0
ms
|
0
ms
|
0
ms
|
2
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
list
.
size
(
)
|
0
ms
|
1
ms
|
73
ms
|
7972
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
size
=
list
.
size
(
)
|
0
ms
|
0
ms
|
67
ms
|
8216
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
for
j
--
|
0
ms
|
1
ms
|
67
ms
|
8277
ms
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
-
|
PS:由于首次遍历List会稍微多耗时一点,for each的结果稍微有点偏差,将测试代码中的几个Type顺序调换会发现,for each耗时和for iterator接近。
从上面我们可以看出:
a 在LinkedList大小接近一万时,get方式和Iterator方式就已经差了差不多两个数量级,十万时Iterator方式性能已经远胜于get方式。
我们看看LinkedList中迭代器和get方法的实现
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
|
private
class
ListItr
implements
ListIterator
<E>
{
private
Node
<E>
lastReturned
=
null
;
private
Node
<E>
next
;
private
int
nextIndex
;
private
int
expectedModCount
=
modCount
;
ListItr
(
int
index
)
{
// assert isPositionIndex(index);
next
=
(
index
==
size
)
?
null
:
node
(
index
)
;
nextIndex
=
index
;
}
public
boolean
hasNext
(
)
{
return
nextIndex
<
size
;
}
public
E
next
(
)
{
checkForComodification
(
)
;
if
(
!
hasNext
(
)
)
throw
new
NoSuchElementException
(
)
;
lastReturned
=
next
;
next
=
next
.
next
;
nextIndex
++
;
return
lastReturned
.
item
;
}
……
}
public
E
get
(
int
index
)
{
checkElementIndex
(
index
)
;
return
node
(
index
)
.
item
;
}
/**
* Returns the (non-null) Node at the specified element index.
*/
Node
<E>
node
(
int
index
)
{
// assert isElementIndex(index);
if
(
index
<
(
size
>>
1
)
)
{
Node
<E>
x
=
first
;
for
(
int
i
=
0
;
i
<
index
;
i
++
)
x
=
x
.
next
;
return
x
;
}
else
{
Node
<E>
x
=
last
;
for
(
int
i
=
size
-
1
;
i
>
index
;
i
--
)
x
=
x
.
prev
;
return
x
;
}
}
|
从上面代码中可以看出LinkedList迭代器的next函数只是通过next指针快速得到下一个元素并返回。而get方法会从头遍历直到index下标,查找一个元素时间复杂度为哦O(n),遍历的时间复杂度就达到了O(n2)。
所以对于LinkedList的遍历推荐使用foreach,避免使用get方式遍历。
(4) ArrayList和LinkedList遍历方式结果对比分析
从上面的数量级来看,同样是foreach循环遍历,ArrayList和LinkedList时间差不多,可将本例稍作修改加大list size会发现两者基本在一个数量级上。
但ArrayList get函数直接定位获取的方式时间复杂度为O(1),而LinkedList的get函数时间复杂度为O(n)。
再结合考虑空间消耗的话,建议首选ArrayList。对于个别插入删除非常多的可以使用LinkedList。
4、结论总结
通过上面的分析我们基本可以总结下:
(1) 无论ArrayList还是LinkedList,遍历建议使用foreach,尤其是数据量较大时LinkedList避免使用get遍历。
(2) List使用首选ArrayList。对于个别插入删除非常多的可以使用LinkedList。
(3) 可能在遍历List循环内部需要使用到下标,这时综合考虑下是使用foreach和自增count还是get方式。