E06：用流收集数据

csdn_life18

已于 2022-02-06 12:54:38 修改

阅读量94

点赞数

分类专栏： Java8新特性文章标签： java

于 2022-02-06 00:22:53 首次发布

原文链接：https://mp.weixin.qq.com/s?__biz=MzU0NjY1OTg3MQ==&mid=2247483729&idx=1&sn=72d6418ca0f9056f67d48f6366ff0f4d&chksm=fb5b0a21cc2c8337a80441dcb699fd809e83f38b0018457f1d2dd0529704567cb81cbd5e5139&scene=21#wechat_redirect

版权

Java8新特性专栏收录该内容

8 篇文章 0 订阅

订阅专栏

原创翎野君翎驿 2020-01-24

翎野君/文

内容概览

目录	课程内容	视频回看	代码位置
E01	通过行为参数化传递代码	哔哩哔哩 ¦ Youtube	behavior-parameterization
E02	Lambda表达式和函数式接口-上	哔哩哔哩 ¦ Youtube	lambda-expressions
E03	Lambda表达式和函数式接口-下	哔哩哔哩 ¦ Youtube	lambda-expressions
E04	介绍和引入流的概念	哔哩哔哩 ¦ Youtube	introducing-streams
E05	使用流	哔哩哔哩 ¦ Youtube	working-with-streams
E06	用流收集数据	哔哩哔哩 ¦ Youtube	collect-data-with-streams
E07	并行数据处理	哔哩哔哩 ¦ Youtube	parallel-data-processing
E08	default默认方法	哔哩哔哩 ¦ Youtube	default-methods
E09	巧用Optional之优雅规避NPE问题	哔哩哔哩 ¦ Youtube	optional-alternative-null
E10	新的日期和时间	哔哩哔哩 ¦ Youtube	new-date-and-time

01.收集器简介

1.收集器介绍

我们在前一章中学到，流可以用类似于数据库的操作帮助我们处理集合。

Java 8中流支持两种类型的操作:中间操作(如filter或map)和终端操作(如count、findFirst、forEach和reduce)。

中间操作可以链接起来，将一个流转换为另一个流。这些操作不会消耗流，其目的是建立一个流水线。与此相反，终端操作会消耗流，以产生一个最终结果，例如返回流中的最大元素。

2.概念辨析

collect：Stream接口中定义的方法用来整合收集流操作的最终结果，其中的一个接口定义为。

<R, A> R collect(Collector<? super T, A, R> collector);

Collector：Collector是专门用来作为Stream的collect方法的参数的，Collector主要包含五个参数，它的行为也是由这五个参数来定义的。

public interface Collector<T, A, R> {
// supplier参数用于生成结果容器，容器类型为A
Supplier<A> supplier();
// accumulator用于消费元素，也就是归纳元素，这里的T就是元素，它会将流中的元素一个一个与结果容器A发生操作
BiConsumer<A, T> accumulator();
// combiner用于两个两个合并并行执行的线程的执行结果，将其合并为一个最终结果A
BinaryOperator<A> combiner();
// finisher用于将之前整合完的结果R转换成为A
Function<A, R> finisher();
// characteristics表示当前Collector的特征值，这是个不可变Set
Set<Characteristics> characteristics();
}

Collectors：Collectors是一个工具类，是JDK预实现Collector的工具类，它内部提供了多种Collector，我们可以直接拿来使用。

Collection：Collection接口是 (java.util.Collection)是Java集合类的顶级接口之一，整个集合框架就围绕一组标准接口而设计。

02.使用Collector进行collect收集

Collector接口中的方法介绍

1. 建立新的结果容器: supplier方法

Supplier supplier()： supplier方法必须返回一个结果为空的Supplier，也就是一个无参数函数，在调用时它会创建一个空的累加器实例，供数据收集过程使用。

2. 将元素添加到结果容器: accumulator方法

BiConsumer<A, T> accumulator()： accumulator方法会返回执行操作的函数。当遍历到流中第n个元素时，这个函数执行时会有两个参数保存归约结果的累加器(已收集了流中的前n-1个项目)，还有第n个元素本身。

3.对结果容器应用最终转换：finisher方法

Function<A, R> finisher()：在遍历完流后，finisher方法必须返回在累积过程的，最后要调用的一个函数，以便将累加器对象转换为整个集合操作的最终结果。

4.合并两个结果容器：combiner方法

BinaryOperator combiner()：四个方法中的最后一个——combiner方法会返回一个供归约操作使用的函数，它定义了对流的各个子部分进行并行处理时，各个子部分归约所得的累加器要如何合并。

5.characteristics方法

Set characteristics()：

Characteristics是一个包含三个项目的枚举。
UNORDERED—— 结果不受流中项目的遍历和累积顺序的影响。
CONCURRENT—— accumulator函数可以从多个线程同时调用，且该收集器可以并行归约流。如果收集器没有标为UNORDERED，那它仅在用于无序数据源时才可以并行归约。
IDENTITY_FINISH——这表明完成器方法返回的函数是一个恒等函数，可以跳过。这种情况下，累加器对象将会直接用作归约过程的最终结果。这也意味着，将累加器A不加检查地转换为结果R是安全的。

执行流程

1.顺序归约过程的逻辑步骤

建立新的结果容器: supplier方法
将元素添加到结果容器: accumulator方法
对结果容器应用最终转换: finisher方法

2.使用combiner来并行化归约过程

示例

1.自己开发一个toList

import cn.hutool.core.collection.CollUtil;
import cn.hutool.core.collection.ListUtil;

import java.util.List;
import java.util.Set;
import java.util.function.BiConsumer;
import java.util.function.BinaryOperator;
import java.util.function.Function;
import java.util.function.Supplier;
import java.util.stream.Collector;

/**
 * 重写toList()方法
 *
 * @param <T>
 */
public class ToListCollectorImpl<T> implements Collector<T, List<T>, List<T>> {

    /**
     * 初始化一个中间状态的结果容器
     *
     * @return
     */
    @Override
    public Supplier<List<T>> supplier() {
        return ListUtil::toList;
    }

    /**
     * 遍历流中的元素，把元素添加到中间状态的结果容器中
     *
     * @return
     */
    @Override
    public BiConsumer<List<T>, T> accumulator() {
        return (a, t) -> a.add(t);
    }

    /**
     * 并行化规约过程中，进行合并操作
     *
     * @return
     */
    @Override
    public BinaryOperator<List<T>> combiner() {
        return (list1, list2) -> {
            list1.addAll(list2);
            return list1;
        };
    }

    /**
     * 将中间状态的结果容器转换为最终的返回结果
     *
     * @return
     */
    @Override
    public Function<List<T>, List<T>> finisher() {
        return Function.identity();
    }

    /**
     * 采用哪些优化建议
     *
     * @return
     */
    @Override
    public Set<Characteristics> characteristics() {
        Set<Characteristics> hashSet = CollUtil.newHashSet();
        hashSet.add(Characteristics.IDENTITY_FINISH);
        hashSet.add(Characteristics.CONCURRENT);
        return hashSet;
    }
}

我们迄今开发的ToListCollectorlmpl是IDENTITY_FINISH的，因为用来累积流中元素的List已经是我们要的最终结果，用不着进一步转换了。
但它并不是UNORDERED，因为用在有序流上的时候，我们还是希望顺序能够保留在得到的List中。最后，它是CONCURRENT的，但我们刚才说过了，仅仅在背后的数据源无序时才会并行处理。

2.collect其他调用形式

对于IDENTITY_FINISH的收集操作，还有一种方法可以得到同样的结果而无需从头实现新的Collectors接口。Stream接口中有一个重载的collect方法可以接受另外三个函数—supplier、accumulator和combiner，其语义和Collector接口的相应方法返回的函数完全相同。

 <R> R collect(Supplier<R> supplier,
                  BiConsumer<R, ? super T> accumulator,
                  BiConsumer<R, R> combiner);
                  
supplier：建立新的结果容器
accumulator：将元素添加到结果容器
combiner：合并两个结果的容器

List<String> stringList = Arrays.asList("abc", "def");
        String result = stringList.stream()
                .collect(() -> new StringBuilder(),
                        (s1, s2) -> s1.append(s2),
                        (r1, r2) -> r1.append(r2))
                .toString();

03.Collectors类

04.小结

collect是一个终端操作，它接受的参数是将流中元素累积到汇总结果的，各种方式(称为收集器)。
预定义收集器包括将流元素归约和汇总到一个值，例如计算最小值、最大值或平均值。
预定义收集器可以用groupingBy对流中元素进行分组，或用partitioningBy进行分区。
你可以实现Collector接口中定义的方法来开发你自己的收集器。

05.配套源码地址

码云地址：https://gitee.com/javaprog/dating-java8-practice

转载：翎野君 - E06：用流收集数据

csdn_life18

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
E06：用流收集数据

原创翎野君翎驿 2020-01-24翎野君/文内容概览目录课程内容视频回看代码位置E01通过行为参数化传递代码哔哩哔哩 ¦ Youtubebehavior-parameterizationE02Lambda表达式和函数式接口-上哔哩哔哩 ¦ Youtubelambda-expressionsE03Lambda表达式和函数式接口-下哔哩哔哩 ¦ Youtubelambda-expressionsE04介绍和引入流的概念哔哩哔哩 ¦ Yo
复制链接

扫一扫

专栏目录