使用 Java 流进行分组和聚合

这篇博客探讨了如何使用Java Streams和Collectors进行分组和聚合操作,特别是处理复杂的多重聚合。通过示例展示了如何计算加权平均值、几何平均值,以及如何在分组后对多个字段进行聚合,同时解决了涉及非原始数据类型的问题。
摘要由CSDN通过智能技术生成

当我们对列表中的元素进行分组时,我们可以随后聚合分组元素的字段以执行有意义的操作,帮助我们分析数据。一些示例是加法、平均值或最大值/最小值。这些单个字段的聚合可以使用 Java Streams 和 Collectors 轻松完成。该文档提供了如何进行这些类型计算的简单示例。

但是,还有更复杂的聚合,例如加权平均值、几何平均值。此外,可能需要同时聚合多个字段。在本文中,我们将展示使用 Java Streams 解决此类问题的直接途径。使用这个框架使我们能够快速有效地处理大量数据。

我们假设读者对Java Streams和实用程序Collectors类有基本的了解。

问题布局

让我们考虑一个简单的例子来展示我们想要解决的问题类型。我们将使它非常通用,以便我们可以轻松地概括它。让我们考虑TaxEntry由以下代码定义的实体列表:

public class TaxEntry {

    private String state;
    private String city;
    private int numEntries;
    private double price;
    //Constructors, getters, hashCode, equals etc
}

计算给定城市的条目总数非常简单:

Map<String, Integer> totalNumEntriesByCity = 
              taxes.stream().collect(Collectors.groupingBy(TaxEntry::getCity, 
                                                           Collectors.summingInt(TaxEntry::getNumEntries)));

Collectors.groupingBy接受两个参数:一个分类器函数进行分组,一个收集器对属于给定组的所有元素进行下游聚合。我们TaxEntry::getCity用作分类器函数。对于下游,我们使用Collectors::summingIntwhich 返回一个Collector总和我们为每个分组元素获得的税收条目的数量。 

如果我们尝试找到复合分组,事情会稍微复杂一些。例如,对于前面的示例,给定州和 城市的条目总数。有几种方法可以做到这一点,但一个非常简单的方法是首先定义:

record StateCityGroup(String state, String city) {}

请注意,我们使用的是 Java record,这是一种定义不可变类的简洁方法。此外,Java 编译器为我们生成字段访问器方法hashCode、、等号和toString实现。有了这个,现在的解决方案很简单:

Map<StateCityGroup, Integer> totalNumEntriesForStateCity = 
                    taxes.stream().collect(groupingBy(p -> new StateCityGroup(p.getState(), p.getCity()), 
                               
  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值