Java8 Stream 数据流，大数据量下的性能效率怎么样？(1)

2401_84181606

于 2024-04-30 01:12:04 发布

阅读量371

点赞数 5

分类专栏：程序员文章标签： windows microsoft 服务器

本文链接：https://blog.csdn.net/2401_84181606/article/details/138330466

版权

程序员专栏收录该内容

153 篇文章 0 订阅

订阅专栏

//stream

List result = list.stream()

.mapToInt(x -> x)

.map(x -> ++x)

.boxed()

.collect(Collectors.toCollection(ArrayList::new));

//iterator

List result = new ArrayList<>();

for(Integer e : list){

result.add(++e);

}

//parallel stream

List result = list.parallelStream()

.mapToInt(x -> x)

.map(x -> ++x)

.boxed()

.collect(Collectors.toCollection(ArrayList::new));

2. 过滤处理测试

取出一个随机数列（List<Integer>）中的大于 200 的元素，并组装为一个新的 List<Integer>，测试的随机数列容量从 10 - 10000000，跑10次取平均时间；

//stream

List result = list.stream()

.mapToInt(x -> x)

.filter(x -> x > 200)

.boxed()

.collect(Collectors.toCollection(ArrayList::new));

//iterator

List result = new ArrayList<>(list.size());

for(Integer e : list){

if(e > 200){

result.add(e);

}

//parallel stream

List result = list.parallelStream()

.mapToInt(x -> x)

.filter(x -> x > 200)

.boxed()

.collect(Collectors.toCollection(ArrayList::new));

3. 自然排序测试

对一个随机数列（List<Integer>）进行自然排序，并组装为一个新的 List<Integer>，iterator 使用的是 Collections # sort API（使用归并排序算法实现），测试的随机数列容量从 10 - 10000000，跑10次取平均时间；

//stream

List result = list.stream()

.mapToInt(x->x)

.sorted()

.boxed()

.collect(Collectors.toCollection(ArrayList::new));

//iterator

List result = new ArrayList<>(list);

Collections.sort(result);

//parallel stream

List result = list.parallelStream()

.mapToInt(x->x)

.sorted()

.boxed()

.collect(Collectors.toCollection(ArrayList::new));

4. 归约统计测试

获取一个随机数列（List<Integer>）的最大值，测试的随机数列容量从 10 - 10000000，跑10次取平均时间；

//stream

int max = list.stream()

.mapToInt(x -> x)

.max()

.getAsInt();

//iterator

int max = -1;

for(Integer e : list){

if(e > max){

max = e;

}

//parallel stream

int max = list.parallelStream()

.mapToInt(x -> x)

.max()

.getAsInt();

5. 字符串拼接测试

获取一个随机数列（List<Integer>）各个元素使用“,”分隔的字符串，测试的随机数列容量从 10 - 10000000，跑10次取平均时间；

//stream

String result = list.stream().map(String::valueOf).collect(Collectors.joining(“,”));

//iterator

StringBuilder builder = new StringBuilder();

for(Integer e : list){

builder.append(e).append(“,”);

}

String result = builder.length() == 0 ? “” : builder.substring(0,builder.length() - 1);

//parallel stream

String result = list.stream().map(String::valueOf).collect(Collectors.joining(“,”));

6. 混合操作测试

对一个随机数列（List<Integer>）进行去空值，除重，映射，过滤，并组装为一个新的 List<Integer>，测试的随机数列容量从 10 - 10000000，跑10次取平均时间；

//stream

List result = list.stream()

.filter(Objects::nonNull)

.mapToInt(x -> x + 1)

.filter(x -> x > 200)

.distinct()

.boxed()

.collect(Collectors.toCollection(ArrayList::new));

//iterator

HashSet set = new HashSet<>(list.size());

for(Integer e : list){

if(e != null && e > 200){

set.add(e + 1);

}

List result = new ArrayList<>(set);

//parallel stream

List result = list.parallelStream()

.filter(Objects::nonNull)

.mapToInt(x -> x + 1)

.filter(x -> x > 200)

.distinct()

.boxed()

.collect(Collectors.toCollection(ArrayList::new));

实验结果总结

从以上的实验来看，可以总结处以下几点：

在少低数据量的处理场景中（size<=1000），stream 的处理效率是不如传统的 iterator 外部迭代器处理速度快的，但是实际上这些处理任务本身运行时间都低于毫秒，这点效率的差距对普通业务几乎没有影响，反而 stream 可以使得代码更加简洁；
在大数据量（szie>10000）时，stream 的处理效率会高于 iterator，特别是使用了并行流，在cpu恰好将线程分配到多个核心的条件下（当然parallel stream 底层使用的是 JVM 的 ForkJoinPool，这东西分配线程本身就很玄学），可以达到一个很高的运行效率，然而实际普通业务一般不会有需要迭代高于10000次的计算；
Parallel Stream 受引 CPU 环境影响很大，当没分配到多个cpu核心时，加上引用 forkJoinPool 的开销，运行效率可能还不如普通的 Stream；

使用 Stream 的建议

简单的迭代逻辑，可以直接使用 iterator，对于有多步处理的迭代逻辑，可以使用 stream，损失一点几乎没有的效率，换来代码的高可读性是值得的；
单核 cpu 环境，不推荐使用 parallel stream，在多核 cpu 且有大数据量的条件下，推荐使用 paralle stream；
stream 中含有装箱类型，在进行中间操作之前，最好转成对应的数值流，减少由于频繁的拆箱、装箱造成的性能损失；

推荐文章2021年4月程序员工资统计：平均14596元，南京程序员收入挤进一线。

常见的SQL面试题：经典50例

47K Star 的SpringBoot+MyBatis+docker电商项目，附带超详细的文档！

写博客能月入10K？

一款基于 Spring Boot 的现代化社区（论坛/问答/社交网络/博客）

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

需要这份系统化资料的朋友，可以戳这里获取

化社区（论坛/问答/社交网络/博客）

[外链图片转存中…(img-Lkjdm66O-1714410680612)]
[外链图片转存中…(img-8ApRARww-1714410680612)]
[外链图片转存中…(img-SrUSlPcz-1714410680613)]

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

需要这份系统化资料的朋友，可以戳这里获取

2401_84181606

关注

5
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
Java8 Stream 数据流，大数据量下的性能效率怎么样？(1)

//streamList result = list.stream().mapToInt(x -> x).map(x -> ++x).boxed().collect(Collectors.toCollection(ArrayList::new));//iteratorList result = new ArrayList();for(Integer e : list){result.add(++e);}//parallel streamList result = list.parallelStream(
复制链接

扫一扫