- parallelStream
对流中的数据进行并行操作,下面是简单的示例:
@Test
public void test() {
List<String> list = new ArrayList<>();
for (int i = 0; i < 4000; i++) {
list.add(i + "");
}
Long startTime = System.currentTimeMillis();
list.parallelStream().forEach(i -> {
try {
Thread.sleep(10);
} catch (InterruptedException e) {
throw new RuntimeException(e);
}
});
//result:7784
list.forEach(i -> {
try {
Thread.sleep(10);
} catch (InterruptedException e) {
throw new RuntimeException(e);
}
});
//result:62212
Long endTime = System.currentTimeMillis();
System.out.println("result:" + (endTime - startTime));
}
在遍历的过程中线程睡眠10毫秒,可以理解为业务所需要的执行时间,可见并行执行和串行执行差异巨大;特别的,并没有看出parallelStream和stream.parallel有什么差异,欢迎大佬指点!
由于在并行执行过程中,使用了ForkJoinPool线程池,所以要考虑线程安全问题:对于ArrayList线程不安全,可以采用Collections.synchronizedList,采用synchronized修饰,或者是CopyOnWriteArrayList,写时复制(读写分离的思想),用到了lock;
对于使用Set的线程不安全,可以使用Collections.synchronizedSet,底层是CopyOnWriteArrayList,或者使用CopyOnWriteArraySet;
map的话用ConcurrentHashMap就好了,HashTable效率低下;
在实际使用的过程中,发现其实一个map定义在并行流外并且只读不写,这个map可以用hashmap,如果线程并没有改变变量,可以考虑用非线程安全集合类,提高性能;
后续写点线程安全之类的吧!