Java-Stream流-概述、创建、使用:遍历/匹配、筛选、聚合、映射、归约、排序、提取/组合

一、Stream流概述

​ Java 8中的Stream流是一种全新的数据处理抽象,它革命性地改变了开发者处理集合数据的方式。Stream API并不是一个真正持有数据的集合,而是一种数据渠道,用于处理具有集合、数组等数据结构支持的数据序列。Stream的核心思想借鉴了函数式编程语言的处理数据方式,强调声明式编程风格,使得开发者能够以更高效、更简洁的方式表达数据处理逻辑。

1.Stream流的特点:

  • 不存储数据:Stream自身不存储数据,而是按需计算,对数据源进行操作时,如集合或数组,它并不会改变这些数据源,而是对它们的视图进行操作。
  • 惰性求值:Stream的操作分为中间操作(Intermediate Operations)和终端操作(Terminal Operations)。中间操作如filter, map等会构建一个管道,直到遇到一个终端操作如collect, forEach, count等时,整个流的处理过程才会执行。这种设计可以优化计算资源,只在必要时处理数据。
  • 函数式编程:紧密结合Lambda表达式,使得编写处理数据的代码变得极其简洁明了,鼓励无副作用的函数,提高了代码的可读性和可维护性。
  • 易于并行处理:Stream API天然支持并行处理,通过调用parallelStream()方法,可以轻松地利用多核处理器的优势,提高数据处理速度,而无需显式管理线程。

2.使用步骤:

  • 创建Stream:可以从集合、数组或生成器等数据源获取Stream。例如,List<String> names = ...; Stream<String> nameStream = names.stream();
  • 链式操作:通过一系列中间操作(如filter, map, sorted等)构建数据处理管道,每个操作都是一个函数,接受前一个操作的结果作为输入。
  • 执行操作:通过调用一个终端操作来执行整个管道,如collect, forEach, reduce等,执行后Stream不能再被使用。

3.常用方法示例:

  • filter(Predicate p):过滤出满足条件的元素。
  • map(Function f):对每个元素应用函数f进行转换。
  • sorted() / sorted(Comparator c):对元素排序。
  • distinct():去除重复元素。
  • limit(long maxSize):限制流中的元素数量。
  • collect(Collectors.toList()):将流转换为列表或其他集合。
  • reduce(T identity, BinaryOperator accumulator):聚合操作,如求和、求最大值等。

二、Stream流创建

1.常见的创建Stream的方法

在Java 8中,创建Stream流有多种方式,以下是几种常见的创建Stream的方法:

  • 从集合创建

​ 最常用的创建Stream的方式是通过集合类提供的stream()parallelStream()方法。几乎所有实现了Collection接口的类(如List, Set, Map(其键或值))都提供了这些方法。

List<String> list = Arrays.asList("a", "b", "c");
Stream<String> stream = list.stream();
  • 从数组创建

使用Arrays.stream()方法可以将数组转换为Stream。

String[] array = {"a", "b", "c"};
Stream<String> stream = Arrays.stream(array);
  • 使用Stream.of()创建

Stream.of()方法允许你直接从多个值创建一个Stream。

Stream<String> stream = Stream.of("a", "b", "c");
  • 使用Stream.generate()创建无限流

当你需要一个无限的Stream时,可以使用Stream.generate()方法,它需要一个Supplier函数来不断提供新的值,通常需要配合limit()来限制流的长度。

Stream<Integer> infiniteStream = Stream.generate(() -> 1).limit(10);
  • 使用Stream.iterate()创建迭代流

Stream.iterate()用于创建一个无限或有限的有序Stream,基于给定的初始值和生成下一个元素的函数。

Stream<Integer> stream = Stream.iterate(0, n -> n + 1).limit(10);
  • 其他特殊方式

​ 对于数值类型,如整数、长整数或双精度浮点数,可以直接使用IntStream, LongStream, DoubleStream的工厂方法,如IntStream.range()IntStream.rangeClosed()来创建基于范围的数值流。

IntStream intStream = IntStream.range(0, 10);

​ 还可以使用特定API创建流,如从文件读取数据到流中,或者使用正则表达式分割字符串为流等。

Test:

2. stream()parallelStream()方法的使用和选择

parallelStream是Java 8引入的一个特性,它允许以并行方式处理集合中的元素,可以更有效地利用多核处理器。从集合创建parallelStream非常直接,只需调用集合的parallelStream()方法即可

public static void main(String[] args) {
    // 创建一个列表
    List<String> names = Arrays.asList("Alice", "Bob", "Charlie", "David", "Eve");

    // 使用parallelStream进行并行处理,这里我们将所有名字转换为大写
    List<String> uppercaseNames = names.parallelStream()
                                      .map(String::toUpperCase)
                                      .collect(Collectors.toList());

    // 输出处理后的名字
    System.out.println(uppercaseNames);
}

stream

public static void main(String[] args) {
    // 创建一个列表
    List<String> names = Arrays.asList("Alice", "Bob", "Charlie", "David", "Eve");

    // 使用stream进行处理,这里我们将所有名字转换为大写
    List<String> uppercaseNames = names.stream()
                                      .map(String::toUpperCase)
                                      .collect(Collectors.toList());

    // 输出处理后的名字
    System.out.println(uppercaseNames);
}

在这里插入图片描述

比较与优势:

  • 控制性与顺序stream串行执行的,这意味着它按照元素的添加顺序依次处理集合中的每个元素。如果你的处理流程需要保持元素的处理顺序,或者处理过程中有严格的顺序依赖,使用stream更安全的选择。它提供了对处理流程的精确控制。

  • 简单性:对于简单的数据处理任务,使用stream通常代码更加直观和简洁,不需要考虑多线程同步问题,减少了潜在的并发错误。

使用parallelStream的优势:

  • 性能提升:在数据量较大且操作允许并行化的场景下,parallelStream可以显著提高处理速度。它通过Java的Fork/Join框架自动将任务分割成多个子任务并行执行,充分利用多核处理器的计算能力。

  • 资源利用率:对于CPU密集型的任务,parallelStream能够更好地利用系统资源,减少处理时间,尤其是在多核处理器上。

选择依据:

  • 数据量与任务性质:如果数据量不大,或者任务主要是I/O密集型(如文件读写、网络通信),并行处理可能不会带来太多性能上的提升,甚至由于线程创建和上下文切换的开销而降低效率。在这种情况下,使用stream可能更合适。

  • 顺序敏感性:如果处理流程中元素的处理顺序至关重要,比如需要基于前一个元素的处理结果来决定下一个元素的处理方式,那么应该使用stream来确保顺序。

  • 任务并行度:对于那些可以高度并行化且CPU密集型的任务,parallelStream能发挥其并行处理的优势,特别是在数据量大的情况下。

​ 总之,选择stream还是parallelStream,需要根据具体的应用场景、数据规模以及任务性质来决定,以达到最佳的性能和效率

三、Stream流使用

Optional

OptionalStream都是Java函数式编程风格的重要组成部分,它们共同促进了代码的清晰度、安全性和高效性,尤其是在处理集合和可能缺失的数据时。通过结合使用,可以编写出更加健壮和表达力强的Java代码

Optional类是Java 8引入的一个容器类,用来表示可能存在也可能不存在的值,主要用于避免空指针异常(NullPointerException)。它是一个可以为null的容器对象如果值存在则isPresent()返回true,调用get()方法会返回该对象;如果值不存在,则isPresent()返回false,调用get()会抛出NoSuchElementException异常Optional类提供了一系列优雅的方法来处理可能缺失的情况,如orElse()orElseGet()orElseThrow()ifPresent()等,鼓励程序员以更加防御性的编程方式处理空值问题。

Optional类的主要方法包括:

  • of(T value):创建一个包含非null值的Optional实例。
  • ofNullable(T value):如果给定的值非null,创建一个Optional实例,否则创建一个空的Optional。
  • empty():创建一个空的Optional实例。
  • isPresent():检查是否有值存在。
  • get():如果Optional中有值,则返回该值,否则抛出NoSuchElementException异常。
  • ifPresent(Consumer<? super T> consumer):如果Optional中有值,则执行提供的消费函数。
  • orElse(T other):如果有值则返回该值,否则返回指定的other值。
  • orElseGet(Supplier<? extends T> other):如果有值则返回该值,否则返回由Supplier提供的值。
  • orElseThrow(Supplier<? extends X> exceptionSupplier):如果有值则返回该值,否则抛出自定义异常。

Optional与Stream流的关系:

虽然OptionalStream都是Java 8中引入的重要特性,它们各自服务于不同的目的,但它们之间存在一定的协同作用。

  1. 在Stream中使用Optional:你可以在Stream的操作中使用Optional,例如,通过map操作将流中的每个元素转换为Optional,然后可以链式调用Optional的方法来安全地处理可能的空值情况,而不会中断流的处理流程。

  2. Optional作为Stream的终点:在某些情况下,Stream的处理结果可能是一个可选值,这时可以使用findFirst()findAny()等终端操作返回Optional,表示可能没有找到匹配项。

  3. flatMap与Optional结合:当处理嵌套的Optional或可选的Stream时,flatMap方法特别有用。它可以将Optional中的值直接映射到另一个Stream,或者在Optional为空时直接返回一个空的Stream,这在处理复杂的链式调用时特别有效,避免了多次检查Optional是否为空。

import java.util.Optional;
 
public class Java8Tester {
   public static void main(String args[]){
   
      Java8Tester java8Tester = new Java8Tester();
      Integer value1 = null;
      Integer value2 = new Integer(10);
        
      // Optional.ofNullable - 允许传递为 null 参数
      Optional<Integer> a = Optional.ofNullable(value1);
        
      // Optional.of - 如果传递的参数是 null,抛出异常 NullPointerException
      Optional<Integer> b = Optional.of(value2);
      System.out.println(java8Tester.sum(a,b));
   }
    
   public Integer sum(Optional<Integer> a, Optional<Integer> b){
    
      // Optional.isPresent - 判断值是否存在
        
      System.out.println("第一个参数值存在: " + a.isPresent());
      System.out.println("第二个参数值存在: " + b.isPresent());
        
      // Optional.orElse - 如果值存在,返回它,否则返回默认值
      Integer value1 = a.orElse(new Integer(0));
        
      //Optional.get - 获取值,值需要存在
      Integer value2 = b.get();
      return value1 + value2;
   }
}

案例中使用的实体类

@Data
public class Order implements Comparable<Order>{
    String productName;
    double price;
    String customerName;

    public Order(String productName, double price, String customerName) {
        this.productName = productName;
        this.price = price;
        this.customerName = customerName;
    }

    @Override
    public int compareTo(Order other) {
        // 这里为了演示,我们假设主要按价格排序,价格相同则按产品名排序
        int priceCompare = Double.compare(this.price, other.price);
        return priceCompare != 0 ? priceCompare : this.productName.compareTo(other.productName);
    }
}


@Data
public class Person {
    String name;
    @Getter
    int age;

    public Person(String name, int age) {
        this.name = name;
        this.age = age;
    }
}

@Data
public class Student {
    private String name;
    private int age;
    private double score;
    private List<String> interestGroups; // 新增字段,表示学生参加的兴趣小组

    public Student(String name, int age, double score, List<String> interestGroups) {
        this.name = name;
        this.age = age;
        this.score = score;
        this.interestGroups = interestGroups;
    }

    public Student(String name, int age, double score) {
    }
}

1.遍历/匹配(foreach/find/match)

public static void StreamOperationsExample {
    // 创建一个字符串列表
    List<String> names = Arrays.asList("Alice", "Bob", "Charlie", "David");

    // 使用forEach遍历并打印名字
    System.out.println("### 使用forEach遍历:");
    names.stream().forEach(name -> System.out.println("姓名: " + name));

    // 使用findFirst查找第一个名字
    System.out.println("\n### 使用findFirst查找第一个名字:");
    Optional<String> firstName = names.stream().findFirst();
    firstName.ifPresent(name -> System.out.println("第一个名字是: " + name));

    // 使用anyMatch检查是否有名字以'C'开头
    System.out.println("\n### 使用anyMatch检查是否有名字以'C'开头:");
    boolean hasNameStartingWithC = names.stream().anyMatch(name -> name.startsWith("C"));
    System.out.println("是否存在以'C'开头的名字? " + (hasNameStartingWithC ? "是" : "否"));
}

在这里插入图片描述

2.筛选(filter)

​ 使用Java 8的Stream API中的filter方法,将处理一个数字集合,进行多步筛选操作。例如:筛选出偶数、去除负数,并找出这些数中的质数,最后计算这些质数的和

public class Filter {
    // 判断是否为质数的辅助方法
    public static boolean isPrime(int number) {
        if (number <= 1) return false;
        for (int i = 2; i <= Math.sqrt(number); i++) {
            if (number % i == 0) return false;
        }
        return true;
    }

    public static void main(String[] args) {
        // 创建一个包含一系列整数的列表
        List<Integer> numbers = new ArrayList<>();
        for (int i = -10; i <= 100; i++) {
            numbers.add(i);
        }

        // 使用Stream进行筛选操作
        // 1. 筛选出非负数
        // 2. 筛选出偶数
        // 3. 筛选出质数
        List<Integer> primeEvenNumbers = numbers.stream()
                .filter(n -> n >= 0) // 去除负数
                .filter(n -> n % 2 == 0) // 筛选偶数
                .filter(Filter::isPrime) // 筛选质数
                .collect(Collectors.toList());

        // 计算筛选后的质数之和
        int sumOfPrimes = primeEvenNumbers.stream().mapToInt(Integer::intValue).sum();

        // 输出结果
        System.out.println("筛选出的偶数并且是质数有:" + primeEvenNumbers);
        System.out.println("这些质数的和为:" + sumOfPrimes);
    }
}

在这里插入图片描述

3.聚合(max/min/count)

public class MaxMinCount {
    public static void main(String[] args) {
        // 创建学生列表
        List<Student> students = new ArrayList<>();
        students.add(new Student("Alice", 20, 88.5));
        students.add(new Student("Bob", 19, 76.0));
        students.add(new Student("Charlie", 22, 94.5));
        students.add(new Student("Diana", 21, 89.0));
        students.add(new Student("Evan", 18, 90.5));

        // 聚合操作
        // 1. 查找年龄最大的学生
        Optional<Student> oldestStudent = students.stream()
                .max(Comparator.comparingInt(Student::getAge));
        oldestStudent.ifPresent(System.out::println);

        // 2. 查找分数最低的学生
        Optional<Student> lowestScoringStudent = students.stream()
                .min(Comparator.comparingDouble(Student::getScore));
        lowestScoringStudent.ifPresent(System.out::println);

        // 3. 统计20岁以上的学生数量
        long countOfStudentsOver20 = students.stream()
                .filter(student -> student.getAge() > 20)
                .count();
        System.out.println("20岁以上的学生数量:" + countOfStudentsOver20);

        // 4. 查找年龄最大且分数最高的学生(假设不存在并列最高分的情况)
        Optional<Student> maxAgeAndScore = students.stream()
                .max(Comparator.comparingInt(Student::getAge)
                        .thenComparingDouble(Student::getScore));
        maxAgeAndScore.ifPresent(System.out::println);
    }
}

在这里插入图片描述

4.映射(map/flatMap)

  • map:map操作是将流中的每个元素应用一个函数进行转换生成一个新的流。这意味着原流中的每个元素都会被一对一地替换为转换后的结果。例如,如果你有一个数字流,你可以使用map将每个数字转换为其平方。

  • flatMap:flatMap同样用于转换流中的每个元素,但它与map的主要区别在于,flatMap能够将流中的每个元素转换为另一个流,然后再将这些流扁平化为一个单一的流。这在处理嵌套结构(如列表的列表)或需要将多个流合并为一个流时特别有用

案例:使用map将兴趣小组列表转换为字符串;使用flatMap整合所有学生兴趣小组为一个去重列表

public class MapFlatMap {
    public static void main(String[] args) {
        // 初始化学生列表
        List<Student> students = Arrays.asList(
                new Student("Alice", 20, 88.5, Arrays.asList("Music", "Art")),
                new Student("Bob", 19, 76.0, Arrays.asList("Sports", "Chess")),
                new Student("Charlie", 22, 94.5, Arrays.asList("Chess", "Coding"))
        );

        // 任务1: 使用map将兴趣小组列表转换为字符串
        List<String> groupStrings = students.stream()
                .map(student -> String.join(",", student.getInterestGroups()))
                .collect(Collectors.toList());
        System.out.println("\n每个学生的兴趣小组字符串:");
        groupStrings.forEach(System.out::println);

        //任务2:将学生的年龄全部增加10
        List<Student> studentsNew = students.stream()
                .map(student -> {
                    Student newStudent = new Student(student.getName(), 0, student.getScore(), new ArrayList<>(student.getInterestGroups()));
                    newStudent.setAge(student.getAge() + 10);
                    return newStudent;
                })
                .collect(Collectors.toList());
        studentsNew.forEach(s -> System.out.println(s.getName() + "的新年龄: " + s.getAge()));

        // 任务3: 使用flatMap整合所有学生兴趣小组为一个去重列表
        Set<String> uniqueInterestGroups = students.stream()
                .flatMap(student -> student.getInterestGroups().stream())
                .collect(Collectors.toSet()); // 直接使用toSet去重
        System.out.println("\n所有学生的独特兴趣小组集合:");
        uniqueInterestGroups.forEach(System.out::println);

        //任务4: 使用flatMap将两个字符数组合并成一个新的字符数组
        List<String> list = Arrays.asList("m,k,l,a", "1,3,5,7");
        List<String> listNew = list.stream().flatMap(s -> {
            // 将每个元素转换成一个stream
            String[] split = s.split(",");
            Stream<String> s2 = Arrays.stream(split);
            return s2;
        }).collect(Collectors.toList());

        System.out.println("处理前的集合:" + list);
        System.out.println("处理后的集合:" + listNew);

    }
}

在这里插入图片描述

在这里插入图片描述

​ 此外,map系列还有mapToInt、mapToLong、mapToDouble三个函数,它们以一个映射函数为入参,将流中每一个元素处理后生成一个新流。以mapToInt为例

假设我们有一个Person对象列表,我们想要计算所有人的年龄总和、平均年龄以及最年长和最年轻的人的年龄。

public class mapToInt {
    public static void main(String[] args) {
        List<Person> people = Arrays.asList(
                new Person("Alice", 30),
                new Person("Bob", 25),
                new Person("Charlie", 35),
                new Person("David", 28)
        );

        // 计算年龄总和
        int totalAge = people.stream().mapToInt(Person::getAge).sum();
        System.out.println("年龄总和: " + totalAge);

        // 计算平均年龄
        double averageAge = people.stream().mapToInt(Person::getAge).average().orElse(Double.NaN);
        System.out.println("平均年龄: " + averageAge);

        // 查找最年长的人的年龄
        OptionalInt maxAge = people.stream().mapToInt(Person::getAge).max();
        System.out.println("最年长的年龄: " + (maxAge.isPresent() ? maxAge.getAsInt() : "无"));

        // 查找最年轻的年龄
        OptionalInt minAge = people.stream().mapToInt(Person::getAge).min();
        System.out.println("最年轻的年龄: " + (minAge.isPresent() ? minAge.getAsInt() : "无"));
    }
}

在这里插入图片描述

5.归约(reduce)

reduce方法是处理集合数据、执行聚合操作如求和、求积、求最大值/最小值等场景的强大工具,同时也是理解和掌握函数式编程思想的关键点之一。

​ 在Java的Stream API中,reduce方法是一种强大的操作,它用于将流中的元素通过某种操作“规约”或“合并”成一个单一的结果值。这个过程涉及到一个累积函数,该函数将两个元素作为输入并产生一个输出,然后将此输出与流中的下一个元素再次应用累积函数,如此循环,直到整个流被处理完毕,最终得到一个单一的结果

归约操作通常涉及四个关键要素

  1. 初始值(Optional): 这是归约操作开始时的起始值。并非所有reduce操作都需要初始值,但如果没有提供,则流必须是非空的。

  2. 累积函数(BinaryOperator): 这是一个接受两个输入参数并返回一个结果的函数。累积函数定义了如何将两个元素合并成一个。例如,加法操作可以作为一个累积函数,用于计算总和。

  3. 身份元素(Identity): 如果提供了初始值,它就是累积过程的身份元素,对于加法来说,0是身份元素,因为任何数加上0都等于其本身;对于乘法,1是身份元素。

  4. 并行归约: Stream API中的reduce方法支持并行处理,这意味着在多线程环境下,流可以被分割成多个部分,各自独立地进行归约,然后再将结果合并。为了确保并行处理的正确性,累积函数必须是关联的且最好是可交换的。

假设我们有一个整数列表,我们想计算所有数字的总和。

不使用初始值

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
Integer sum = numbers.stream().reduce((a, b) -> a + b).orElse(0); // 如果流为空,返回0作为默认值
System.out.println(sum); // 输出 15

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
Optional<Integer> sumOptional = numbers.stream().reduce((a, b) -> a + b); //返回一个Optional
sumOptional.ifPresent(sum -> System.out.println(sum)); // 输出 15

在这个例子中,没有提供初始值,因此流必须非空。累积函数 (a, b) -> a + b 定义了如何将两个元素相加。

使用初始值

Integer sumWithInit = numbers.stream().reduce(0, (a, b) -> a + b);
System.out.println(sumWithInit); // 同样输出 15

这里提供了初始值0,即使流为空,结果也是0,而不是返回一个Optional。

并行归约

当使用.parallel()方法使流并行处理时,reduce操作会自动适应并行环境,但需要注意累积函数的性质以确保正确性。

Integer parallelSum = numbers.parallelStream().reduce(0, Integer::sum);
System.out.println(parallelSum); // 输出 15,结果与串行相同

在这个并行处理的例子中,我们直接使用了Integer::sum方法引用作为累积函数,它保证了操作的正确性和高效性。

案例

public class Reduce {
    public static void main(String[] args) {
        // 初始化一个数列,包含了一些数字
        List<Double> numbers = Arrays.asList(1.5, 2.0, 3.0, 4.0, 5.0);

        // 使用reduce计算所有数字的乘积
        OptionalDouble product = numbers.stream()
                .mapToDouble(Double::doubleValue) // 转换为DoubleStream以进行乘法运算
                .reduce((a, b) -> a * b); // 累乘操作

        // 处理结果
        String resultMessage = product.isPresent()
                ? "数列的乘积为: " + product.getAsDouble()
                : "数列为空,定义乘积为1";
        
        System.out.println(resultMessage);

        //找出一个数列中的最大值和最小值
        List<Integer> numberList = Arrays.asList(44, 55, 11, 99, 22);

        int max = numberList.stream()
                .reduce(Integer.MIN_VALUE, Integer::max);
        int min = numberList.stream()
                .reduce(Integer.MAX_VALUE, Integer::min);
        
        System.out.println("数列中的最大值为: " + max);
        System.out.println("数列中的最小值为: " + min);

        //字符串连接
        List<String> words = Arrays.asList("Hello", " ", "World", "!");
        String sentence = words.stream()
                .reduce("", String::concat);
        
        System.out.println("拼接后的字符串为: " + sentence);
        
    }
}

在这里插入图片描述

6.收集(collect)

collect方法结合Collectors类的静态方法,能够轻松实现复杂的数据汇聚和转换操作,是处理流数据不可或缺的工具

collect是Java Stream API中的一个关键操作,它用于将流中的元素汇聚成一个结果容器,如List、Set、Map等,或者汇聚成一个特定的结果,如计算总数、平均值等。collect操作高度灵活,是通过Collector接口来定义的,但实际上,大多数情况下,我们会直接使用java.util.stream.Collectors类中提供的静态工厂方法来构造Collector实例,以完成常见的汇聚操作

Collectors类简介

Collectors类提供了丰富的静态方法,用于创建各种Collector实例,从而实现流的归约操作。这些方法包括但不限于:

  • toList():将流中的元素收集到一个List中。
  • toSet():将流中的元素收集到一个Set中,自动去除重复项。
  • toMap(Function keyMapper, Function valueMapper):将流中的元素转换为键值对,收集到一个Map中。
  • counting():计算流中元素的数量。
  • summingInt(ToIntFunction mapper):计算流中元素的某个整数属性的总和。
  • averagingDouble(ToDoubleFunction mapper):计算流中元素的某个double属性的平均值。
  • joining(CharSequence delimiter):将流中的元素连接成一个字符串,元素间用指定的分隔符分隔。
6.1 归集(toList/toSet/toMap)
public class ToListToSetToMap {
    public static void main(String[] args) {
        List<Order> orders = Arrays.asList(
                new Order("Apple", 100.0, "Alice"),
                new Order("Banana", 50.0, "Bob"),
                new Order("Orange", 80.0, "Alice"),
                new Order("Pear", 70.0, "Charlie"),
                new Order("Apple", 120.0, "Alice")
        );

        // 1. 收集所有不同的商品名称到一个去重的列表中
        Set<String> uniqueProductNames = orders.stream()
                .map(Order::getProductName)
                .collect(Collectors.toSet());
        System.out.println("所有不同的商品名称: " + uniqueProductNames);

        // 2. 按客户名分组,收集每个客户的订单到单独的列表中
        Map<String, List<Order>> ordersByCustomer = orders.stream()
                .collect(Collectors.groupingBy(Order::getCustomerName));
        System.out.println("按客户分组的订单列表: " + ordersByCustomer);

        // 3. 创建一个映射,键为客户名,值为该客户购买的所有不同商品名的集合
        Map<String, Set<String>> productsByCustomer = orders.stream()
                .collect(Collectors.groupingBy(
                        Order::getCustomerName,
                        Collectors.mapping(Order::getProductName, Collectors.toSet())
                ));
        System.out.println("每个客户购买的所有不同商品集合: " + productsByCustomer);

        // 4. 计算每个客户的总消费额,并以Map形式返回(键为客户名,值为总消费额)
        Map<String, Double> totalSpentByCustomer = orders.stream()
                .collect(Collectors.groupingBy(Order::getCustomerName,
                        Collectors.summingDouble(Order::getPrice)));
        System.out.println("每个客户的总消费额: " + totalSpentByCustomer);

        // 5. 将特定条件的订单收集到列表中(例如,价格超过100的订单)
        List<Order> expensiveOrders = orders.stream()
                .filter(order -> order.getPrice() > 100.0)
                .collect(Collectors.toList());
        System.out.println("价格超过100的订单列表: " + expensiveOrders);

    }
}

所有不同的商品名称: [Apple, Pear, Orange, Banana]
按客户分组的订单列表: {Bob=[Order(productName=Banana, price=50.0, customerName=Bob)], Alice=[Order(productName=Apple, price=100.0, customerName=Alice), Order(productName=Orange, price=80.0, customerName=Alice), Order(productName=Apple, price=120.0, customerName=Alice)], Charlie=[Order(productName=Pear, price=70.0, customerName=Charlie)]}
每个客户购买的所有不同商品集合: {Bob=[Banana], Alice=[Apple, Orange], Charlie=[Pear]}
每个客户的总消费额: {Bob=50.0, Alice=300.0, Charlie=70.0}
价格超过100的订单列表: [Order(productName=Apple, price=120.0, customerName=Alice)]

toMapmapping的区别

toMap直接生成Map,用于键值对的收集;而mapping则是作为数据转换的工具用于在收集过程中的数据预处理,通常与其它收集器联合使用以达到最终的收集目标

toMapmapping在Java 8 Stream API中都是用来转换和收集数据的方法,但它们在用途和应用场景上有明显的区别。

toMap

toMap是一个收集器(Collector),它将流中的元素转换为键值对,并收集到一个Map中。toMap通常接收两个函数作为参数:一个是将流元素转换为Map的键的函数,另一个是转换为Map的值的函数。此外,还可以提供一个合并函数来处理键冲突的情况。toMap直接生成Map类型的输出,适用于将流数据结构转换为Map结构的场景。

例如:

Map<String, Integer> map = people.stream()
    .collect(Collectors.toMap(Person::getName, Person::getAge));

在这个例子中,Person::getName用于提取人名作为键,Person::getAge用于提取年龄作为值。

mapping

mapping是另一个收集器工厂方法,它不是直接生成Map,而是用于在收集过程中对流元素进行中间转换。它通常与其他收集器一起使用,作为数据转换的一步,帮助准备数据进入最终的收集阶段。mapping接收一个函数,用于将流中的每个元素转换为新的形式,然后将这个转换应用于后续的收集操作中,如toList, toSet, 或者是进一步的toMap

例如,如果我们想先将Person的姓名转换为大写,再收集到一个Set中:

Set<String> names = people.stream()
    .collect(Collectors.mapping(Person::getName, Collectors.toCollection(HashSet::new)).toUpperCase());

注意这里的示例是概念性的说明,实际使用时,由于mapping返回的仍然是一个Collector,所以我们需要正确地嵌套它与其他收集器一起使用,如:

Set<String> names = people.stream()
    .map(Person::getName)
    .map(String::toUpperCase)
    .collect(Collectors.toCollection(HashSet::new));

在这个修正后的例子中,我们先通过map方法转换,然后直接收集到Set中,因为直接使用mapping后接toCollection的语法在实际代码中并不直接适用。

6.2 统计(count/average)
public class CountAverage {
    public static void main(String[] args) {
        List<Order> orders = Arrays.asList(
                new Order("Apple", 100.0, "Alice"),
                new Order("Banana", 50.0, "Bob"),
                new Order("Orange", 80.0, "Alice"),
                new Order("Pear", 70.0, "Charlie"),
                new Order("Apple", 120.0, "Alice")
        );

        // 订单总数统计
        long totalOrders = orders.stream().count();
        System.out.println("订单总数: " + totalOrders);

        // 商品平均价格计算
        OptionalDouble averagePrice = orders.stream()
                .mapToDouble(Order::getPrice)
                .average();
        if (averagePrice.isPresent()) {
            System.out.println("商品平均价格: " + averagePrice.getAsDouble());
        } else {
            System.out.println("无法计算平均价格,列表为空");
        }

        // 特定商品的购买次数统计 - 以"Apple"为例
        long applePurchaseCount = orders.stream()
                .filter(order -> "Apple".equals(order.getProductName()))
                .count();
        System.out.println("\"Apple\"的购买次数: " + applePurchaseCount);

        // 每个客户的订单数量
        Map<String, Long> ordersPerCustomer = orders.stream()
                .collect(Collectors.groupingBy(Order::getCustomerName, Collectors.counting()));
        System.out.println("每个客户的订单数量: " + ordersPerCustomer);
    }
}

运行结果:

订单总数: 5
商品平均价格: 84.0
"Apple"的购买次数: 2
每个客户的订单数量: {Bob=1, Alice=3, Charlie=1}

6.3 分组(partitioningBy/groupingBy)
  • partitioningBy:适用于二分数据,即基于一个条件将数据分为两组。
  • groupingBy:适用于多路分组,可以基于任意函数对数据进行灵活的分组,支持更复杂的分组逻辑和多级分组。
public class PartitioningByAndGroupingBy {
    public static void main(String[] args) {
        List<Order> orders = Arrays.asList(
                new Order("Apple", 100.0, "Alice"),
                new Order("Banana", 50.0, "Bob"),
                new Order("Orange", 80.0, "Alice"),
                new Order("Pear", 70.0, "Charlie"),
                new Order("Apple", 120.0, "Alice")
        );

        // 使用partitioningBy根据订单价格是否超过100元分组
        Map<Boolean, List<Order>> ordersByPriceThreshold = orders.stream()
                .collect(Collectors.partitioningBy(order -> order.getPrice() > 100.0));
        System.out.println("根据价格是否超过100元分组: " + ordersByPriceThreshold);

        // 使用groupingBy按客户名分组,并进一步按商品名分组
        Map<String, Map<String, List<Order>>> ordersGroupedByCustomerAndProduct = orders.stream()
                .collect(Collectors.groupingBy(Order::getCustomerName,
                        Collectors.groupingBy(Order::getProductName)));
        System.out.println("按客户名和商品名分组的订单: " + ordersGroupedByCustomerAndProduct);

        // 使用groupingBy并配合reducing计算每个客户的总消费
        Map<String, Double> totalSpentByCustomer = orders.stream()
                .collect(Collectors.groupingBy(Order::getCustomerName,
                        Collectors.reducing(0.0, Order::getPrice, Double::sum)));
        System.out.println("每个客户的总消费: " + totalSpentByCustomer);
    }
}

运行结果:

根据价格是否超过100元分组: {false=[Order(productName=Apple, price=100.0, customerName=Alice), Order(productName=Banana, price=50.0, customerName=Bob), Order(productName=Orange, price=80.0, customerName=Alice), Order(productName=Pear, price=70.0, customerName=Charlie)], true=[Order(productName=Apple, price=120.0, customerName=Alice)]}

按客户名和商品名分组的订单: {Bob={Banana=[Order(productName=Banana, price=50.0, customerName=Bob)]}, Alice={Apple=[Order(productName=Apple, price=100.0, customerName=Alice), Order(productName=Apple, price=120.0, customerName=Alice)], Orange=[Order(productName=Orange, price=80.0, customerName=Alice)]}, Charlie={Pear=[Order(productName=Pear, price=70.0, customerName=Charlie)]}}

每个客户的总消费: {Bob=50.0, Alice=300.0, Charlie=70.0}

6.4 接合(joining)

joining是Java 8 Stream API中的一个收集器(Collector),主要用于将流中的元素连接成一个字符串。它属于Collectors类的一个静态方法,常用于生成CSV格式的字符串、构建SQL语句的IN子句拼接描述性文本等场景。joining提供了灵活的选项来控制元素间的分隔符、前缀、后缀,以及如何处理空流的情况

public class Joining {
    public static void main(String[] args) {
        List<Order> orders = Arrays.asList(
            new Order("Apple", 100.0, "Alice"),
            new Order("Banana", 50.0, "Bob"),
            new Order("Orange", 80.0, "Alice"),
            new Order("Pear", 70.0, "Charlie"),
            new Order("Apple", 120.0, "Alice")
        );

        // 使用joining连接所有订单的商品名称,以逗号分隔
        String productList = orders.stream()
            .map(Order::getProductName)
            .collect(Collectors.joining(", "));
        
        System.out.println("所有订单的商品列表: " + productList);
    }
}

运行结果:

所有订单的商品列表: Apple, Banana, Orange, Pear, Apple

6.5 归约(reducing)

reducing是Java 8 Stream API中的一个操作,它用于将流中的元素通过某个函数累积成一个单一的结果。归约是将集合中的元素反复结合起来,最终得到一个值的过程。这个过程通常包括一个起始值(identity),一个二元操作(binary operator)来合并两个元素,以及一个可选的映射函数(mapping function)来在应用二元操作之前转换元素

归约的基本概念

  • 起始值(Identity):累积操作的初始值,对于加法来说通常是0,乘法则是1。
  • 二元操作(Binary Operator):定义了如何将两个元素结合成一个新值的函数。例如,(a, b) -> a + b 表示加法操作。
  • 映射函数(Mapping Function):在实际累积之前对流中的每个元素应用的可选转换操作。例如,如果流中是对象,而你想累积它们的某个属性值,就需要先通过映射函数提取这个属性。
public class Reducing {
    public static void main(String[] args) {
        List<Order> orders = Arrays.asList(
                new Order("Apple", 100.0, "Alice"),
                new Order("Banana", 50.0, "Bob"),
                new Order("Orange", 80.0, "Alice"),
                new Order("Pear", 70.0, "Charlie"),
                new Order("Apple", 120.0, "Alice")
        );

        // 使用Collectors.reducing计算所有订单的总金额
        Double totalAmount = orders.stream()
                .collect(Collectors.reducing(0.0, Order::getPrice, Double::sum));

        System.out.println("所有订单的总金额为: " + totalAmount);
    }
}

运行结果:

所有订单的总金额为: 420.0

7.排序(sorted)

​ 在Java 8的Stream API中,sorted是一个中间操作,用于对流中的元素进行排序。排序可以根据元素的自然顺序进行,也可以根据**自定义的比较器(Comparator)**来进行。排序操作不会修改原有的数据源,而是返回一个新的流,其中的元素是排序后的顺序

排序的分类

  • 自然排序:当流中的元素实现了Comparable接口时,可以使用自然排序。例如,数字和字符串可以直接按照它们的自然顺序进行排序。
  • 定制排序:通过提供一个Comparator对象,可以自定义排序逻辑。这允许根据对象的不同属性或复杂的比较规则进行排序。
public class sorted {
    public static void main(String[] args) {
        List<Order> orders = Arrays.asList(
                new Order("Apple", 100.0, "Alice"),
                new Order("Banana", 50.0, "Bob"),
                new Order("Orange", 80.0, "Alice"),
                new Order("Pear", 70.0, "Charlie"),
                new Order("Apple", 120.0, "Alice")
        );

        // 自然排序示例:假设Order实现了Comparable接口,根据compareTo方法定义的规则排序
        List<Order> sortedByNatural = orders.stream()
                .sorted()
                .collect(Collectors.toList());
        System.out.println("自然排序后的订单:");
        sortedByNatural.forEach(System.out::println);

        // 定制排序示例:根据价格降序排序,价格相同则按产品名升序排序
        Comparator<Order> priceDescProductAsc = Comparator
                .comparing(Order::getPrice, Comparator.reverseOrder())
                .thenComparing(Order::getProductName);
        List<Order> sortedByPriceAndProduct = orders.stream()
                .sorted(priceDescProductAsc)
                .collect(Collectors.toList());
        System.out.println("\n按价格降序、产品名升序排序后的订单:");
        sortedByPriceAndProduct.forEach(System.out::println);
    }
}

运行结果:

自然排序后的订单:
Order(productName=Banana, price=50.0, customerName=Bob)
Order(productName=Pear, price=70.0, customerName=Charlie)
Order(productName=Orange, price=80.0, customerName=Alice)
Order(productName=Apple, price=100.0, customerName=Alice)
Order(productName=Apple, price=120.0, customerName=Alice)

按价格降序、产品名升序排序后的订单:
Order(productName=Apple, price=120.0, customerName=Alice)
Order(productName=Apple, price=100.0, customerName=Alice)
Order(productName=Orange, price=80.0, customerName=Alice)
Order(productName=Pear, price=70.0, customerName=Charlie)
Order(productName=Banana, price=50.0, customerName=Bob)

8.distinct/limit/skip

在Java 8的Stream API中,distinct, limit, 和 skip 是非常实用的中间操作用于过滤和控制流中的数据

  • distinct

distinct操作用于去除流中的重复元素。它基于流元素的equalshashCode方法来判断元素是否相同。这意味着如果流中的对象正确覆写了这两个方法,distinct就能准确地去除重复的对象

  • limit

limit操作用于限制流中元素的数量,只保留前N个元素。这对于性能优化特别有用,尤其是在处理大量数据时,你可能只需要查看前几条记录

  • skip

skip操作则是跳过流中的前N个元素返回剩余的元素。这在实现分页或者跳过某些已知不需要处理的数据时非常有用。

public class DistinctLimitSkip {
    public static void main(String[] args) {
        List<Order> orders = Arrays.asList(
                new Order("Apple", 100.0, "Alice"),
                new Order("Banana", 50.0, "Bob"),
                new Order("Orange", 80.0, "Alice"),
                new Order("Pear", 100.0, "Charlie"),
                new Order("Apple", 120.0, "Alice") // 注意这里有重复的产品名但价格不同
        );

        // 使用distinct去除按compareTo定义的重复订单(这里会基于价格和产品名去重)
        List<Order> uniqueOrders = orders.stream()
                .distinct()
                .collect(Collectors.toList());
        System.out.println("去重后的订单(基于价格和产品名):");
        uniqueOrders.forEach(System.out::println);

        // 使用limit获取排序后的前两个订单
        List<Order> firstTwoSortedOrders = orders.stream()
                .sorted() // 根据compareTo方法排序
                .limit(2)
                .collect(Collectors.toList());
        System.out.println("\n排序后的前两个订单:");
        firstTwoSortedOrders.forEach(System.out::println);

        // 使用skip跳过排序后的前两个订单,然后取两个
        List<Order> nextTwoSortedOrders = orders.stream()
                .sorted()
                .skip(2)
                .limit(2)
                .collect(Collectors.toList());
        System.out.println("\n排序后,跳过前两个的两个订单:");
        nextTwoSortedOrders.forEach(System.out::println);
    }
}

运行结果:

去重后的订单(基于价格和产品名):
Order(productName=Apple, price=100.0, customerName=Alice)
Order(productName=Banana, price=50.0, customerName=Bob)
Order(productName=Orange, price=80.0, customerName=Alice)
Order(productName=Pear, price=100.0, customerName=Charlie)
Order(productName=Apple, price=120.0, customerName=Alice)

排序后的前两个订单:
Order(productName=Banana, price=50.0, customerName=Bob)
Order(productName=Orange, price=80.0, customerName=Alice)

排序后,跳过前两个的两个订单:
Order(productName=Apple, price=100.0, customerName=Alice)
Order(productName=Pear, price=100.0, customerName=Charlie)

  • 41
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小孔靠得住

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值