Java Stream API groupingBy()介绍

最新推荐文章于 2023-12-10 19:08:17 发布

长江水面写日记

最新推荐文章于 2023-12-10 19:08:17 发布

阅读量752

点赞数

原文链接：https://www.jdon.com/50132

版权

groupingBy()是Stream API中最强大的收集器Collector之一，提供与SQL的GROUP BY子句类似的功能。

使用形式如下：

.collect(groupingBy(...));

需要指定一个属性才能使用，通过该属性执行分组。我们通过提供功能接口的实现来实现这一点 - 通常通过传递lambda表达式。

例如，如果我们想按长度对字符串进行分组，我们可以通过将String :: length传递给groupingBy（）来实现：

List<String> strings = List.of("a", "bb", "cc", "ddd"); 

Map<Integer, List<String>> result = strings.stream() 
  .collect(groupingBy(String::length)); 

System.out.println(result); // {1=[a], 2=[bb, cc], 3=[ddd]}
<p>

分组到自定义Map实现

如果需要提供自定义Map实现，可以使用提供的groupingBy（）重载来实现：

List<String> strings = List.of("a", "bb", "cc", "ddd");

TreeMap<Integer, List<String>> result = strings.stream()
  .collect(groupingBy(String::length, TreeMap::new, toList()));

System.out.println(result); // {1=[a], 2=[bb, cc], 3=[ddd]}
<p>

提供自定义的下一个Collection

如果需要将分组元素存储在自定义集合中，可以使用toCollection（）收集器来实现。

例如，如果要在TreeSet实例中对元素进行分组，然后输出到一个新的Collection，则可以这样简单：

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, TreeSet<String>> result = strings.stream()
  .collect(groupingBy(String::length, toCollection(TreeSet::new)));

System.out.println(result); // {1=[a], 2=[bb, cc], 3=[ddd]}
<p>

分组计数

如果您只想知道分组元素的数量，提供自定义counting()j就可以：

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, Long> result = strings.stream()
  .collect(groupingBy(String::length, counting()));

System.out.println(result); // {1=1, 2=2, 3=1}
<p>

将每个组转为字符串

如果需要对元素进行分组并为每个组创建单个String表示，可以使用join（）来实现：

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, String> result = strings.stream()
  .collect(groupingBy(String::length, joining(",", "[", "]")));

System.out.println(result); // {1=[a], 2=[bb,cc], 3=[ddd]}
<p>

分组和过滤条目

从分组结果中排除某些条目。这可以使用filtering（）收集器来实现：

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, List<String>> result = strings.stream()
  .collect(groupingBy(String::length, filtering(s -> !s.contains("c"), toList())));

System.out.println(result); // {1=[a], 2=[bb], 3=[ddd]}
<p>

分组和计算每组平均值

如果需要派生每组条目的平均属性，那么有一些方便的收集器：

averagingInt（）

averagingLong（）

averagingDouble（）

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, Double> result = strings.stream()
  .collect(groupingBy(String::length, averagingInt(String::hashCode)));

System.out.println(result); // {1=97.0, 2=3152.0, 3=99300.0}

分组和计算每组的总和

如果要对分组条目进行累计总和：

summingInt（）

summingLong（）

summingDouble（）

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, Integer> result = strings.stream()
  .collect(groupingBy(String::length, summingInt(String::hashCode)));

System.out.println(result); // {1=97, 2=6304, 3=99300}

reducing缩减操作

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, List<Character>> result = strings.stream()
  .map(toStringList())
  .collect(groupingBy(List::size, reducing(List.of(), (l1, l2) -> Stream.concat(l1.stream(), l2.stream())
    .collect(Collectors.toList()))));

System.out.println(result); // {1=[a], 2=[b, b, c, c], 3=[d, d, d]}

计算最大最小值

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, Optional<String>> result = strings.stream()
  .collect(groupingBy(String::length, Collectors.maxBy(Comparator.comparing(String::toUpperCase))));

System.out.println(result); // {1=Optional[a], 2=Optional[cc], 3=Optional[ddd]}

组合Collector

示例＃1

假设我们有一个字符串列表，并希望获得与长度大于1的大写字符串相关联的字符串长度的映射，并将它们收集到TreeSet实例中。

var result = strings.stream()
  .collect(
    groupingBy(String::length,
      mapping(String::toUpperCase,
        filtering(s -> s.length() > 1,
          toCollection(TreeSet::new)))));

//result
{1=[], 2=[BB, CC], 3=[DDD]}

例＃2

指定字符串列表，按匹配长度对它们进行分组，转换为字符列表，展平获取的列表，仅保留具有非零长度的不同元素，并最终通过应用字符串连接来减少它们。

var result = strings.stream()
  .collect(
    groupingBy(String::length,
      mapping(toStringList(),
        flatMapping(s -> s.stream().distinct(),
          filtering(s -> s.length() > 0,
            mapping(String::toUpperCase,
              reducing("", (s, s2) -> s + s2)))))
    ));

//result 
{1=A, 2=BC, 3=D}