Java并行开发——并行数据

DF_Orange

已于 2023-12-19 00:49:42 修改

阅读量1.1k

点赞数 26

文章标签： java 开发语言

于 2023-12-19 00:48:31 首次发布

本文链接：https://blog.csdn.net/jackprovence/article/details/135068295

版权

本文介绍了JavaStreamAPI中的聚合操作，如filter、map和sorted，重点讲解了reduce方法的工作原理和使用，以及并行流的引入以提升性能。讨论了适合和不适合使用并行计算的情况，提醒开发者在实际项目中根据任务复杂度和硬件条件选择合适的计算模式。

摘要由CSDN通过智能技术生成

流合并

Stream API，包括 filter、map、sorted 都统称为 聚合操作。

聚合操作就是把集合中的对象做整体性的计算。

一般来说，计算、操作、处理这几个词都是表达的同一个意思，都是比较宽泛的含义。尤其是计算，不要以为仅仅是加减乘除。

小案例

对 1-10 的十个正整数求和：

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10);

普通的使用 for 循环完成计算的代码实现是：

int sum = 0;
for (int i : numbers) {
    sum += i;
}

System.out.println("sum : " + sum);

而使用 Stream API 完成计算的代码实现是：

import java.util.Arrays;

int sum = numbers.stream()
    .reduce((a, b) -> a + b)
    .get();

System.out.println("1-10求和 : " + sum);

reduce() 方法的作用，是合并了所有的元素，终止计算出一个结果。注意这里终止的意思，就是流已经到达终点结束了，不能再继续流动了。

reduce() 方法的返回值是一个比较复杂的对象，需要调用 get() 方法返回最终的整数值。

同理，get() 方法返回值的类型，也是系统自动根据流中元素类型推定的。

reduce() 方法的参数就稍微有点复杂了（重点理解）：

a 在第一次执行计算语句 a + b 时，指代流的第一个元素；然后充当缓存作用以存放本次计算结果。此后执行计算语句时，a 的值就是上一次的计算结果并继续充当缓存存放本次计算结果。
b 参数第一次执行计算语句时指代流的第二个元素。此后依次指代流的每个元素。

注意：a、b 两个参数的作用是由位置决定的，变量名是任意的

结合下图理解：

reduce() 方法的第一个参数（本例的 a）有多重作用，并且系统是自动完成参数（本例的 a, b）赋值的，所以仍然体现了 Stream 编程的重点仍然是计算（本例的 a + b）。

reduce() 方法也是可以操作对象的。

对于上节习题中的数据：

List<Student> students = new ArrayList<>();
students.add(new Student("赵祯", 92));
students.add(new Student("曹丹姝", 60));
... ...
... ...

计算三年二班的学生的分数，并在 Console 中打印本班级学生平均分。

如果需求比较复杂，可能简单的整数就不够了，就要使用 Student 对象：

Student result = students.stream()
    .reduce(
        (a, b) -> {
            a.setMidtermScore(a.getMidtermScore() + b.getMidtermScore());
            return a;
        }
    )
    .get();

System.out.println(result.getName() + " - " + result.getMidtermScore());

Console 的输出结果是：

赵祯 - 777

这是 bug，如果计算后，再在网页上显示每位同学的分数，赵祯同学的分数就错误的显示成 777 分。

出现 bug 的主要原因是，第一个 Student 对象由于充当了缓存角色，正确性被破坏了。

解决办法

reduce() 提供了另一种参数形式，可以自己 new 一个对象充当缓存角色，而不是使用流中的原始对象。

Student result = students.stream()
    .reduce(new Student("", 0),
        (a, b) -> {
            a.setMidtermScore(a.getMidtermScore() + b.getMidtermScore());
            return a;
        }
    );

System.out.println(result.getName() + " - " + result.getMidtermScore());

reduce() 方法的参数变为了两个：

第一个参数，是作为缓存角色的对象
第二个参数，是 Lambda 表达式，完成计算，格式是一样的。
- 那么 a 变量不再指代流中的第一个元素了，专门指代缓存角色的对象，即方法第一个参数对象。
- b 变量依次指代流的每个元素，包括第一个元素。
- a、b 职责非常清晰了。

对照下图理解 a、b 参数的功能变化：

reduce() 方法的返回值同样发送了变化，返回作为缓存角色的对象，即第一个参数。

不用再调用一次 get() 方法了。

赵祯 - 92
- 777

流中的原始对象没有被破坏，在一个没有姓名的缓存对象中存放计算结果。没有 bug 了

小结

从 reduce() 的学习可以感受到，对于整个 Java 流的设计，由于系统会自动做很多事情，所以在学习和理解时，知识点是比较隐晦的，逻辑也有点复杂。

但是一旦理解后，写代码就爽快很多，编程的焦点更加明确了。

可以说，特点是 “约定大于代码” 。Java 把规范制定好了，开发者只要专注于开发计算逻辑。

流收集

在实际工作中，整体功能如果比较复杂的话，使用流对集合进行计算后，可能并不想输出和合并，而是把结果元素放在一个新的集合中，待进一步使用。

例如，新的集合可以传递给 Thymeleaf 模板等等。

小习题：对于一组数字：

List<Integer> numbers = Arrays.asList(3, 2, 2, 7, 63, 2, 3, 5);

找出最大的前 3 个数字放入一个新的集合中，用 - 组合成字符串打印。

import java.util.stream.Collectors;

List<String> numResult = numbers.stream()
    .sorted((n1, n2) -> n2 - n1)
    .limit(3)
    .map(a -> "" + a)
    .collect(Collectors.toList());

String string = String.join("-", numResult);
System.out.println("字符串是: " + string);

collect() 方法的作用就是收集元素，但元素收集存放到哪去呢？Collectors.toList() 是一个静态方法，作为参数告诉 collect() 方法存入一个 List 集合。所以 collect() 方法的返回值类型就是 List。