Stream的部分用法

最新推荐文章于 2022-12-22 14:36:41 发布

java转行当和尚

最新推荐文章于 2022-12-22 14:36:41 发布

阅读量355

点赞数

分类专栏： java 文章标签： Stream的部分用法

本文链接：https://blog.csdn.net/qq_39235296/article/details/102707925

版权

java 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

Java 8 中的 Stream 是对集合（Collection）对象功能的增强，它专注于对集合对象进行各种非常便利、高效的聚合操作（aggregate operation），或者大批量数据操作 (bulk data operation)。Stream API 借助于同样新出现的 Lambda 表达式，极大的提高编程效率和程序可读性。同时它提供串行和并行两种模式进行汇聚操作，并发模式能够充分利用多核处理器的优势，使用 fork/join 并行方式来拆分任务和加速处理过程。通常编写并行代码很难而且容易出错, 但使用 Stream API 无需编写一行多线程的代码，就可以很方便地写出高性能的并发程序。所以说，Java 8 中首次出现的 java.util.stream 是一个函数式语言+多核时代综合影响的产物。

Stream 的另外一大特点是，数据源本身可以是无限的
获取一个数据源（source）→ 数据转换→执行操作获取想要的结果，每次转换原有 Stream 对象不改变，返回一个新的 Stream 对象（可以有多次转换），这就允许对其操作可以像链条一样排列，变成一个管道，如下图所示
在这里插入图片描述

流的操作类型分为两种：
Intermediate：一个流可以后面跟随零个或多个 intermediate 操作。其目的主要是打开流，做出某种程度的数据映射/过滤，然后返回一个新的流，交给下一个操作使用。这类操作都是惰性化的（lazy），就是说，仅仅调用到这类方法，并没有真正开始流的遍历。
Terminal：一个流只能有一个 terminal 操作，当这个操作执行后，流就被使用“光”了，无法再被操作。所以这必定是流的最后一个操作。Terminal 操作的执行，才会真正开始流的遍历，并且会生成一个结果，或者一个 side effect。

在对于一个 Stream 进行多次转换操作 (Intermediate 操作)，每次都对 Stream 的每个元素进行转换，而且是执行多次，这样时间复杂度就是 N（转换次数）个 for 循环里把所有操作都做掉的总和吗？其实不是这样的，转换操作都是 lazy 的，多个转换操作只会在 Terminal 操作的时候融合起来，一次循环完成。我们可以这样简单的理解，Stream 里有个操作函数的集合，每次转换操作就是把转换函数放入这个集合中，在 Terminal 操作的时候循环 Stream 对应的集合，然后对每个元素执行所有的函数。

还有一种操作被称为 short-circuiting。用以指：
对于一个 intermediate 操作，如果它接受的是一个无限大（infinite/unbounded）的 Stream，但返回一个有限的新 Stream。
对于一个 terminal 操作，如果它接受的是一个无限大的 Stream，但能在有限的时间计算出结果。
当操作一个无限大的 Stream，而又希望在有限时间内完成操作，则在管道内拥有一个 short-circuiting 操作是必要非充分条件。

接下来，当把一个数据结构包装成 Stream 后，就要开始对里面的元素进行各类操作了。常见的操作可以归类如下。

1、Intermediate operations(中间操作)： map (mapToInt, flatMap 等)、 filter、
distinct、 sorted、 peek、 limit、 skip、 parallel、 sequential、
unordered、concat

2、Terminal operations(结束操作)： forEach、 forEachOrdered、 toArray、 reduce、
collect、 min、 max、 count、 anyMatch、 allMatch、 noneMatch、 findFirst、
findAny、 iterator

3、Short-circuiting(短路循环)： anyMatch、 allMatch、 noneMatch、 findFirst、
findAny、 limit

我们下面看一下 Stream 的比较典型用法。
map/flatMap
我们先来看 map。如果你熟悉 scala 这类函数式语言，对这个方法应该很了解，它的作用就是把 input Stream 的每一个元素，映射成 output Stream 的另外一个元素。
flatMap 把 input Stream 中的层级结构扁平化，就是将最底层元素抽出来放到一起，最终 output 的新 Stream 里面已经没有 List 了，都是直接的数字。

forEach 不能修改自己包含的本地变量值，也不能用 break/return 之类的关键字提前结束循环

Collectors --把 Stream 元素进行归组 groupingBy/partitioningBy

根据集合中的某个对象的属性分组并取出同组中时间最大的

Map<String, Optional<WProductPriceComparison>> collect = wProductPriceComparisons.stream().
        collect(Collectors.groupingBy(WProductPriceComparison::getSupplierName, Collectors.maxBy((x, y)
                -> x.getOfferPriceTime().compareTo(y.getOfferPriceTime()))));

将集合中的对象某个属性相加

BigDecimal avgPrice = resultEntryValue.stream().map(wProductPriceComparison -> wProductPriceComparison.getProductPrice()).
        reduce((x, y) -> x.add(y)).orElse(new BigDecimal(0)).
        divide(new BigDecimal(resultEntryValue.size()), 2, BigDecimal.ROUND_HALF_UP);

规约操作（reduction operation）又被称作折叠操作（fold），是通过某个连接动作将所有元素汇总成一个汇总结果的过程。元素求和、求最大值或最小值、求出元素总个数、将所有元素转换成一个列表或集合，都属于规约操作。Stream类库有两个通用的规约操作reduce()和collect()，也有一些为简化书写而设计的专用规约操作，比如sum()、max()、min()、count()等。

根据集合中对象某个属性条件过滤之后的数据相加

Integer availableStock = resultEntryValue.stream().filter(wProductPriceComparison -> wProductPriceComparison.
        getProductPrice().subtract(avgPrice).compareTo(BigDecimal.ZERO) <= 0).
        map(wProductPriceComparison -> wProductPriceComparison.getInventoryStatus()).reduce((x, y) -> x + y).orElse(0);

总之，Stream 的特性可以归纳为：
不是数据结构
它没有内部存储，它只是用操作管道从 source（数据结构、数组、generator function、IO channel）抓取数据。
它也绝不修改自己所封装的底层数据结构的数据。例如 Stream 的 filter 操作会产生一个不包含被过滤元素的新 Stream，而不是从 source 删除那些元素。
所有 Stream 的操作必须以 lambda 表达式为参数
不支持索引访问
你可以请求第一个元素，但无法请求第二个，第三个，或最后一个。不过请参阅下一项。
很容易生成数组或者 List
惰性化
很多 Stream 操作是向后延迟的，一直到它弄清楚了最后需要多少数据才会开始。
Intermediate 操作永远是惰性化的。
并行能力
当一个 Stream 是并行化的，就不需要再写多线程代码，所有对它的操作会自动并行进行的。
可以是无限的
集合有固定大小，Stream 则不必。limit(n) 和 findFirst() 这类的 short-circuiting 操作可以对无限的 Stream 进行运算并很快完成。

https://github.com/CarpenterLee/JavaLambdaInternals

java转行当和尚

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Stream的部分用法

Java 8 中的 Stream 是对集合（Collection）对象功能的增强，它专注于对集合对象进行各种非常便利、高效的聚合操作（aggregate operation），或者大批量数据操作 (bulk data operation)。Stream API 借助于同样新出现的 Lambda 表达式，极大的提高编程效率和程序可读性。同时它提供串行和并行两种模式进行汇聚操作，并发模式能够充分利用多...
复制链接

扫一扫