了解使用 Java Streams 解决问题的直接途径,Java Streams 是一个允许我们快速有效地处理大量数据的框架。
当我们对列表中的元素进行分组时,我们可以随后聚合分组元素的字段以执行有意义的操作,帮助我们分析数据。一些示例是加法、平均值或最大值/最小值。这些单个字段的聚合可以使用 Java Streams 和 Collectors 轻松完成。该文档提供了如何进行这些类型计算的简单示例。
但是,还有更复杂的聚合,例如加权平均值、几何平均值。此外,可能需要同时聚合多个字段。在本文中,我们将展示使用 Java Streams 解决此类问题的直接途径。使用这个框架使我们能够快速有效地处理大量数据。
我们假设读者对Java Streams和实用程序Collectors类有基本的了解。
问题布局
让我们考虑一个简单的例子来展示我们想要解决的问题类型。我们将使它非常通用,以便我们可以轻松地概括它。让我们考虑TaxEntry
由以下代码定义的实体列表:
public class TaxEntry {
private String state;
private String city;
private int numEntries;
private double price;
//Constructors, getters, hashCode, equals etc
}
计算给定城市的条目总数非常简单:
Map<String, Integer> totalNumEntriesByCity =
taxes.stream().collect(Collectors.groupingBy(TaxEntry::getCity,
Collectors.summingInt(TaxEntry::getNumEntries)));
Collectors.groupingBy
接受两个参数:一个分类器函数进行分组,一个收集器对属于给定组的所有元素进行下游聚合。我们TaxEntry::getCity
用作分类器函数。对于下游,我们使用Collectors::summingInt
which 返回一个Collector
总和我们为每个分组元素获得的税收条目的数量。
如果我们尝试找到复合分组,事情会稍微复杂一些。例如,对于前面的示例,给定州和 城市的条目总数。有几种方法可以做到这一点,但一个非常简单的方法是首先定义:
record StateCityGroup(String state, String city) {}
请注意,我们使用的是 Java record
,这是一种定义不可变类的简洁方法。此外,Java 编译器为我们生成字段访问器方法hashCode
、、等号和toString
实现。有了这个,现在的解决方案很简单:
Map<StateCityGroup, Integer> totalNumEntriesForSt