Java 8 中引入的 Stream
API 是为了简化对集合类库(例如 List
和 Set
)的操作,同时支持声明式编程风格和并行操作。Stream
不存储数据,而是对数据源进行流水线式操作,其设计核心是“将数据处理的每一步链接起来,并将操作延迟到最终需要结果时执行”。
以下是 Java 8 Stream
流的详细介绍,包括其创建、常用操作和示例代码。
1. Stream 的创建
Stream
可以通过多种方式创建,主要有以下几种方式:
1.1 通过集合(如 List
或 Set
)创建流
List<String> list = Arrays.asList("apple", "banana", "cherry");
Stream<String> stream = list.stream();
1.2 通过数组创建流
String[] arr = {"apple", "banana", "cherry"};
Stream<String> stream = Arrays.stream(arr);
1.3 通过 Stream.of()
创建流
Stream<String> stream = Stream.of("apple", "banana", "cherry");
1.4 通过 Stream.generate()
创建无限流
Stream<Double> randoms = Stream.generate(Math::random).limit(10);
1.5 通过 Stream.iterate()
创建无限流
Stream<Integer> numbers = Stream.iterate(0, n -> n + 2).limit(10);
2. Stream 的操作类型
Stream
操作分为两类:
- 中间操作:返回一个新的
Stream
,可以进行链式调用,常见的有filter
、map
、sorted
等。 - 终端操作:执行实际计算并返回结果,常见的有
forEach
、reduce
、collect
、count
等。
2.1 中间操作
2.1.1 filter()
filter()
用于过滤掉不符合条件的元素。
List<String> result = list.stream()
.filter(s -> s.startsWith("a"))
.collect(Collectors.toList());
2.1.2 map()
map()
用于将元素映射到另一个元素,通常用于类型转换或数据提取。
List<Integer> lengths = list.stream()
.map(String::length)
.collect(Collectors.toList());
2.1.3 sorted()
sorted()
用于对流中的元素进行排序,可以是自然排序,也可以是自定义排序。
List<String> sortedList = list.stream()
.sorted()
.collect(Collectors.toList());
2.1.4 distinct()
distinct()
用于去除流中的重复元素。
List<String> distinctList = list.stream()
.distinct()
.collect(Collectors.toList());
2.1.5 limit()
limit()
用于截断流,使其不超过给定数量。
List<String> limitedList = list.stream()
.limit(2)
.collect(Collectors.toList());
2.1.6 skip()
skip()
用于跳过前 n 个元素。
List<String> skippedList = list.stream()
.skip(1)
.collect(Collectors.toList());
2.2 终端操作
2.2.1 forEach()
forEach()
用于对流中的每个元素执行一个操作。一般用于遍历流元素。
list.stream().forEach(System.out::println);
2.2.2 collect()
collect()
是终端操作之一,用于将流中的元素汇总成一个集合或其它结果类型。
List<String> result = list.stream()
.filter(s -> s.length() > 5)
.collect(Collectors.toList());
2.2.3 reduce()
reduce()
是一种聚合操作,常用于将流中的元素组合成一个值。
int sum = Stream.of(1, 2, 3, 4).reduce(0, Integer::sum);
2.2.4 count()
count()
用于返回流中元素的个数。
long count = list.stream().count();
2.2.5 findFirst()
和 findAny()
findFirst()
返回流中的第一个元素(Optional 类型)。findAny()
返回流中任意一个元素(适用于并行流时)。
Optional<String> first = list.stream().findFirst();
2.2.6 anyMatch()
、allMatch()
和 noneMatch()
anyMatch()
用于检查是否有至少一个元素匹配给定的条件。allMatch()
用于检查是否所有元素都匹配给定的条件。noneMatch()
用于检查是否没有元素匹配给定的条件。
boolean anyMatch = list.stream().anyMatch(s -> s.startsWith("a"));
3. 并行流
Java 8 的 Stream
提供了并行处理能力,parallelStream()
可以实现流的并行处理,提高性能,尤其在大数据量处理时非常有用。
3.1 创建并行流
List<String> list = Arrays.asList("apple", "banana", "cherry");
list.parallelStream().forEach(System.out::println);
4. 综合示例
下面是一个综合示例,展示如何使用流操作对一个字符串列表进行过滤、排序和收集操作:
List<String> list = Arrays.asList("apple", "banana", "cherry", "date", "elderberry");
// 使用 Stream 进行一系列操作
List<String> result = list.stream()
.filter(s -> s.length() > 5) // 过滤长度大于5的字符串
.sorted() // 排序
.map(String::toUpperCase) // 转换为大写
.collect(Collectors.toList()); // 收集结果
System.out.println(result); // 输出: [BANANA, CHERRY, ELDERBERRY]
5. Stream API 常用 Collectors
Collectors
提供了多种汇总流数据的方式,以下是一些常见的 Collectors
使用方式:
5.1 toList()
将流中的元素收集到 List
中:
List<String> list = stream.collect(Collectors.toList());
5.2 toSet()
将流中的元素收集到 Set
中:
Set<String> set = stream.collect(Collectors.toSet());
5.3 joining()
将流中的字符串连接为一个字符串:
String result = stream.collect(Collectors.joining(", "));
5.4 groupingBy()
根据某个条件将元素分组:
Map<Integer, List<String>> groupedByLength = stream.collect(Collectors.groupingBy(String::length));
5.5 partitioningBy()
将流中的元素根据布尔条件分为两组:
Map<Boolean, List<String>> partitioned = stream.collect(Collectors.partitioningBy(s -> s.length() > 5));
总结
Java 8 Stream
API 提供了非常强大的声明式操作集合的方式。通过中间操作可以实现复杂的流水线式操作,终端操作则负责最终的结果计算。Stream
API 简化了数据处理逻辑,特别是通过并行流可以提高性能,使得处理大数据集变得更加高效和直观。