收集器简介
在之前的例子中,我们利用 collect() 方法把流中的元素聚合到 List 或 Set 中。collect() 接收一个类型为 Collector 的参数,这个参数决定了如何把流中的元素聚合到其它数据结构中。Collectors 类包含了大量常用收集器的工厂方法,toList() 和 toSet() 就是其中最常见的两个,除了它们还有很多收集器,用来对数据进行对复杂的转换。
Collector 的类型由其输入类型和输出类型决定。以 toList() 收集器为例,它的输入类型为 T,输出类型为 List<T>
,toMap 是另外一个较为复杂的 Collector,它有若干个版本。最简单的版本接收一对函数作为输入,其中一个函数用来生成键(key),另一个函数用来生成值(value)。toMap 的输入类型是 T,输出类型是Map<K, V>
,其中 K 和 V 分别是前面两个函数所生成的键类型和值类型。
收集器的使用
归约
流由一个个元素组成,归约就是将一个个元素“折叠”成一个值,如求和、求最值、求平均值都是归约操作。
计数
long count = list.stream()
.collect(Collectors.counting());
也可以不使用收集器的计数函数:
long count = list.stream().count();
注意:计数的结果一定是long类型。
最值
例:找出所有人中年龄最大的人
Optional<Person> oldPerson = list.stream()
.collect(Collectors.maxBy(Comparator.comparingInt(Person::getAge)));
计算最值需要使用Collector.maxBy和Collector.minBy,这两个函数需要传入一个比较器Comparator.comparingInt,这个比较器又要接收需要比较的字段。
这个收集器将会返回一个Optional类型的值。
求和
计算所有人的年龄总和
int summing = list.stream()
.collect(Collectors.summingInt(Person::getAge));
当然,既然Java8提供了summingInt,那么还提供了summingLong、summingDouble。
求平均值
例:计算所有人的年龄平均值
double avg = list.stream()
.collect(Collectors.averagingInt(Person::getAge));
注意:计算平均值时,不论计算对象是int、long、double,计算结果一定都是double。
一次性计算所有归约操作
Collectors.summarizingInt函数能一次性将最值、均值、总和、元素个数全部计算出来,并存储在对象IntSummaryStatisics中。
可以通过该对象的getXXX()函数获取这些值。
连接字符串
例:将所有人的名字连接成一个字符串
String names = list.stream()
.collect(Collectors.joining());
每个字符串默认分隔符为空格,若需要指定分隔符,则在joining中加入参数即可:
String names = list.stream()
.collect(Collectors.joining(", "));
一般性的归约操作
若你需要自定义一个归约操作,那么需要使用Collectors.reducing函数,该函数接收三个参数:
- 第一个参数为归约的初始值
- 第二个参数为归约操作进行的字段
- 第三个参数为归约操作的过程
例:计算所有人的年龄总和
Optional<Integer> sumAge = list.stream()
.collect(Collectors.reducing(0,Person::getAge,(i,j)->i+j));
上面例子中,reducing函数一共接收了三个参数:
- 第一个参数表示归约的初始值。我们需要累加,因此初始值为0
- 第二个参数表示需要进行归约操作的字段。这里我们对Person对象的age字段进行累加。
- 第三个参数表示归约的过程。这个参数接收一个Lambda表达式,而且这个Lambda表达式一定拥有两个参数,分别表示当前相邻的两个元素。由于我们需要累加,因此我们只需将相邻的两个元素加起来即可。
Collectors.reducing方法还提供了一个单参数的重载形式。
你只需传一个归约的操作过程给该方法即可(即第三个参数),其他两个参数均使用默认值。
- 第一个参数默认为流的第一个元素
- 第二个参数默认为流的元素
这就意味着,当前流的元素类型为数值类型,并且是你要进行归约的对象。
分组
分组就是将流中的元素按照指定类别进行划分,类似于SQL语句中的GROUPBY。
一级分组
例:将所有人分为老年人、中年人、青年人
Map<String,List<Person>> result = list.stream()
.collect(Collectors.groupingby((person)->{
if(person.getAge()>60)
return "老年人";
else if(person.getAge()>40)
return "中年人";
else
return "青年人";
}));
groupingby函数接收一个Lambda表达式,该表达式返回String类型的字符串,groupingby会将当前流中的元素按照Lambda返回的字符串进行分组。
分组结果是一个Map< String,List< Person>>,Map的键就是组名,Map的值就是该组的Perosn集合。
多级分组
多级分组可以支持在完成一次分组后,分别对每个小组再进行分组。
使用具有两个参数的groupingby重载方法即可实现多级分组。
- 第一个参数:一级分组的条件
- 第二个参数:一个新的groupingby函数,该函数包含二级分组的条件
例:将所有人分为老年人、中年人、青年人,并且将每个小组再分成:男女两组。
Map<String,Map<String,List<Person>>> result = list.stream()
.collect(Collectors.groupingby((person)->{
if(person.getAge()>60)
return "老年人";
else if(person.getAge()>40)
return "中年人";
else
return "青年人";
},
groupingby(Person::getSex)));
对分组进行统计
拥有两个参数的groupingby函数不仅仅能够实现多几分组,还能对分组的结果进行统计。
例:统计每一组的人数
lect(Collectors.groupingby((person)->{
if(person.getAge()>60)
return "老年人";
else if(person.getAge()>40)
return "中年人";
else
return "青年人";
},
counting()));
此时会返回一个Map< String,Long>类型的map,该map的键为组名,map的值为该组的元素个数。