当我们在使用parallelStream去开启多线程处理任务的时候,在需要得到最终处理结果会出问题。举个栗子。。。
public static void main(String[] args) throws InterruptedException {
List<Integer> list = new ArrayList();
List<Integer> list1 = new ArrayList();
for (int i = 0; i < 100; i++) {
list.add(i);
}
long startTime = System.currentTimeMillis();
list.parallelStream().forEach(i -> {
System.out.println(i);
list1.add(i);
}
);
long endTime = System.currentTimeMillis();
System.out.println((endTime - startTime)+ "ms");
System.out.println(list1.size());
}
运行结果:
可以看到本来应该是100000才对,少了四条,之前我错误的以为这是因为在打印size的时候,还有四条线程并没有执行完成,导致我们的结果是错误的,其实真正的问题是因为我使用线程不安全的arraylist导致的,多线程执行arraylist的add方法会有问题。在我们需要使用parallelStream处理后的结果的时候要特别注意。
这时我们可以使用stream,stream会顺序执行
或者我们可以使用CopyOnWriteArrayList,它的add方法是线程安全的。
parallelStream和Stream的效率比较:
public static void main(String[] args) throws InterruptedException {
List<Integer> list = new ArrayList();
for (int i = 0; i < 200000; i++) {
list.add(i);
}
long startTime = System.currentTimeMillis();
list.parallelStream().forEach(i -> {
System.out.println(i);
}
);
long endTime = System.currentTimeMillis();
System.out.println("total "+(endTime - startTime)+ "ms");
}
type/records | 100 | 1000 | 10000 | 100000 | 1000000 |
---|---|---|---|---|---|
Stream | 94ms | 99ms | 215ms | 422ms | 3296ms |
parallelStream | 111ms | 113ms | 169ms | 708ms | 1080ms |
可以明显的看到只有当数据达到一定量的时候,parallelStream才能够发挥出多线程的优势,数据量太少使用parallelStream反而会拖累效率,而且容易出现多线程安全的问题。