一、 Lambda
Lambda允许把函数作为一个方法的参数(函数作为参数传递进方法中),或者把代码看成数据,同时引入了函数式接口的概念,函数式接口就是一个具有一个方法的普通接口,这样的接口,可以被隐士转换为lambda表达式,在实际使用过程中,函数式接口时容易出错的,如某个人在接口定义中增加了另一个方法,这时这个接口就不再是函数式接口了,并且编译过程会失败,为了克服这种脆弱性并且能够明确声明接口作为函数式接口的意图,Java 8增加了一种特殊的注解@FunctionalInterface(静态方法和默认方法并不影响函数式接口的契约)。这个新的特性的目的,就是为了消除单方法接口实现的匿名内部类。
Java 8中增加了一个新的包:Java.util.function,它里面包含了常用的函数式接口:
①Predicate<T>——接收T对象并返回boolean
②Consumer<T>——接收T对象,不返回值
③Function<T, R>——接收T对象,返回R对象
④Supplier<T>——提供T对象(例如工厂),不接收值
⑤UnaryOperator<T>——接收T对象,返回T对象
⑥BinaryOperator<T>——接收两个T对象,返回T对象
在Java8以前的版本中,定义一个Thread是这样的:
1 final int i = 0; 2 new Thread(new Runnable() { 3 @Override 4 public void run() { 5 System.out.println("i = " + i); 6 } 7 }).start();
而Lambda是这样的:
1 int i = 0; 2 new Thread(() -> System.out.println("i = " + i));
首先不看Lambda本身的写法,可以发现,对于外层局部变量i值的访问,在Lambda中已经不需要声明i为final了,但要确保其不备修改,所以还是建议用final修饰。
其次,要明白一个重要的道理:Lambda要求实现的接口中只有一个方法,像上面的Runnable接口就只有一个run方法,如果一个接口中有多于一个方法,则不能写成Lambda的形式。
最后来看标准的Lambda表达式的结构:
结构很简单,小括号表示参数列表,大括号表示方法体,中间使用一个 "->" 隔开即可。
这里的参数体和方法体分别指的是接口中方法的参数体和方法体。
接着我们看一个比较比较复杂的:
1 ArrayList<Integer> integers = new ArrayList<>(); 2 integers.add(6); 3 integers.add(2); 4 integers.add(5); 5 integers.sort((o1, o2) -> o1 - o2); 6 System.out.println(integers);
可以看到,创建了一个ArrayList,里面的元素是Integer类型,接着调用sort()方法对其进行排序,sort方法接受一个Comparator接口的实现类,这个接口中有且仅有一个方法compare,所以如果使用匿名内部类的写法,如下所示:
1 integers.sort(new Comparator<Integer>() { 2 @Override 3 public int compare(Integer o1, Integer o2) { 4 return o1 - o2; 5 } 6 });
可以发现,这里参数列表和方法体都很明白了,要注意的是,这里的方法体中不带{},原因就是当方法体只有一个语句的时候,{}可以省略。
另外,return关键字也被省略了,原因是编译器会认为,既然只有一个语句,那么这个语句执行的结果就应该是返回值,所以return也就不需要了。同理,当参数只有一个的时候,小括号也是可以省略的。
明白这种对应的关系,Lambda就算是掌握了。
二、方法引用
方法引用包括几种情况:
- 静态方法引用
- 构造方法引用
- 类成员方法引用
- 对象方法引用
要注意这里的方法引用实际上是某些Lambda表达式的更简洁写法,原因就是在这些情况下,编译器能够智能的推断出参数体中的值究竟是方法的传入参数还是调用者。
先定义一个Car类:
1 import java.util.function.Supplier; 2 3 public class Car { 4 // 通过Supplier获取Car实例 5 public static Car create(Supplier<Car> supplier) { 6 return supplier.get(); 7 } 8 9 // 静态方法,一个入参Car对象 10 public static void collide(final Car car) { 11 System.out.println("Collide " + car.toString()); 12 } 13 14 // 一个入参Car 15 public void follow(final Car car) { 16 System.out.println("Following car " + car.toString()); 17 } 18 19 // 不带入参 20 public void repair() { 21 System.out.println("Repaired car " + this.toString()); 22 } 23 }
--构造方法引用
Supplier接口的定义:
@FunctionalInterface public interface Supplier<T> { /** * Gets a result. * * @return a result */ T get(); }
这个接口被FunctionalInterface注解声明了,这个注解是一个新的注解,表明这个接口是一个函数式接口,只有一个抽象方法。
所以我们调用静态方法create创建Car对象的时候,代码应该是如下所示的:
1 Car.create(new Supplier<Car>() { 2 @Override 3 public Car get() { 4 return new Car(); 5 } 6 });
但是我们才说了Lambda表达式,所以更简单的写法就是:
1 Car.create(()->new Car());
可以看到,Car类存在一个不带参数的构造方法,所以编译器不需要根据参数列表猜测构造方法的参数(因为都是空的),所以就有一个更加简单的写法:
1 Car.create(Car::new);
实际上,如果Lambda的参数个数和类的构造方法个数一致,也可以改写为上面的形式,只要是没有歧义即可。
--静态方法引用
这里开始会涉及一些Streams内容,但是可以先忽略,后面会详细说。
我们创建一个Car对象,接着将其添加进一个List中:
1 final Car car = Car.create(Car::new); 2 final List<Car> cars = Arrays.asList(car);
Java8中给Iterable接口添加了forEach方法方便我们遍历集合类型。
现在假设我们要给List中的每个Car对象调用一次Car.collide(Car car)静态方法,那么可以使用forEach方法,而forEach方法需要传入一个Consumer,恰好,这个Consumer接口也带有FunctionalInterface注解,所以我们一步一步的来看:
1 cars.forEach(new Consumer<Car>() { 2 @Override 3 public void accept(Car car) { 4 Car.collide(car); 5 } 6 });
写成Lambda:
1 cars.forEach(c -> Car.collide(c));
就是对传进来的Car对象执行静态方法,很简单。但是实际上,对于静态方法,编译器也不需要推断调用者(类名),当传入参数和静态方法所需参数个数一致时,就不存在歧义:
所以这里可以直接使用方法引用:
1 cars.forEach(Car::collide);
--类成员方法引用
类的成员方法不能是静态的,而这个情况其实和静态方法类似,区别是,Lambda表达式的参数个数需要等于所调用方法的入参个数加一。
为什么要加一?
因为类的成员方法不能通过类名直接调用,只能通过对象来调用,也就是Lambda表达式的第一个参数,是方法的调用者,从第二个开始的参数个数要和需要调用方法的入参个数一致即可。如下图所示:
对于上面的例子,如果要对List中的每个对象执行一次它的repair方法:
1 cars.forEach(c -> c.repair());
根据上图,这里参数只有一个,而repair方法没有入参,所以不存在歧义,即可以改写为对应的方法引用:
1 cars.forEach(Car::repair);
--对象方法引用
与类方法引用不同的是,对象方法引用方法的调用者是一个外部的对象。如下图:
对于上面例子,可以再创建一个Car的对象police,并让police调用follow方法跟踪List中的每个Car:
1 final Car police = Car.create(Car::new); 2 cars.forEach((car1) -> police.follow(car1));
改成对象方法引用:
1 cars.forEach(police::follow);
三、Stream
Stream可以说是一个高级版本的Iterator,原始版本的Iterator,用户只能一个个的遍历元素并对其执行某些操作,高级版本的Stream,用户只需要给出需要对其包含的元素执行什么操作即可。
最常用的创建Stream有两种途径:
- 通过Stream接口的静态工厂方法(注意:Java8里接口可以带静态方法);
- 通过Collection接口的默认方法(默认方法:Default method,也是Java8中的一个新特性,就是接口中的一个带有实现的方法,后续文章会有介绍)–stream(),把一个Collection对象转换成Stream
① 使用Stream静态方法来创建Stream
1. of方法:有两个overload方法,一个接受变长参数,一个接口单一值
1 | Stream<Integer> integerStream = Stream.of( 1 , 2 , 3 , 5 ); |
2 | Stream<String> stringStream = Stream.of( "taobao" ); |
2. generator方法:生成一个无限长度的Stream,其元素的生成是通过给定的Supplier(这个接口可以看成一个对象的工厂,每次调用返回一个给定类型的对象)
1 | Stream.generate( new Supplier<Double>() { |
2 | @Override |
3 | public Double get() { |
4 | return Math.random(); |
5 | } |
6 | }); |
7 | Stream.generate(() -> Math.random()); |
8 | Stream.generate(Math::random); |
三条语句的作用都是一样的,只是使用了lambda表达式和方法引用的语法来简化代码。每条语句其实都是生成一个无限长度的Stream,其中值是随机的。这个无限长度Stream是懒加载,一般这种无限长度的Stream都会配合Stream的limit()方法来用。
3. iterate方法:也是生成无限长度的Stream,和generator不同的是,其元素的生成是重复对给定的种子值(seed)调用用户指定函数来生成的。其中包含的元素可以认为是:seed,f(seed),f(f(seed))无限循环
1 | Stream.iterate( 1 , item -> item + 1 ).limit( 10 ).forEach(System.out::println); |
这段代码就是先获取一个无限长度的正整数集合的Stream,然后取出前10个打印。千万记住使用limit方法,不然会无限打印下去。
② 通过Collection子类获取Stream
这个在本文的第一个例子中就展示了从List对象获取其对应的Stream对象,如果查看Java doc就可以发现Collection接口有一个stream方法,所以其所有子类都都可以获取对应的Stream对象。
1 | public interface Collection<E> extends Iterable<E> { |
2 | //其他方法省略 |
3 | default Stream<E> stream() { |
4 | return StreamSupport.stream(spliterator(), false ); |
5 | } |
6 | } |
③转换Stream
转换Stream其实就是把一个Stream通过某些行为转换成一个新的Stream。Stream接口中定义了几个常用的转换方法,下面我们挑选几个常用的转换方法来解释。
1. distinct: 对于Stream中包含的元素进行去重操作(去重逻辑依赖元素的equals方法),新生成的Stream中没有重复的元素;
distinct方法示意图(**以下所有的示意图都要感谢[RxJava](https://github.com/Netflix/RxJava)项目的doc中的图片给予的灵感, 如果示意图表达的有错误和不准确的地方,请直接联系我。**):
2. filter: 对于Stream中包含的元素使用给定的过滤函数进行过滤操作,新生成的Stream只包含符合条件的元素;
filter方法示意图:
3. map: 对于Stream中包含的元素使用给定的转换函数进行转换操作,新生成的Stream只包含转换生成的元素。这个方法有三个对于原始类型的变种方法,分别是:mapToInt,mapToLong和mapToDouble。这三个方法也比较好理解,比如mapToInt就是把原始Stream转换成一个新的Stream,这个新生成的Stream中的元素都是int类型。之所以会有这样三个变种方法,可以免除自动装箱/拆箱的额外消耗;
map方法示意图:
4. flatMap:和map类似,不同的是其每个元素转换得到的是Stream对象,会把子Stream中的元素压缩到父集合中;
flatMap方法示意图:
5. peek: 生成一个包含原Stream的所有元素的新Stream,同时会提供一个消费函数(Consumer实例),新Stream每个元素被消费的时候都会执行给定的消费函数;
peek方法示意图:
6. limit: 对一个Stream进行截断操作,获取其前N个元素,如果原Stream中包含的元素个数小于N,那就获取其所有的元素;
limit方法示意图:
7. skip: 返回一个丢弃原Stream的前N个元素后剩下元素组成的新Stream,如果原Stream中包含的元素个数小于N,那么返回空Stream;
skip方法示意图:
8. 在一起,在一起!
1 | List<Integer> nums = Lists.newArrayList( 1 , 1 , null , 2 , 3 , 4 , null , 5 , 6 , 7 , 8 , 9 , 10 ); |
2 | System.out.println(“sum is:”+nums.stream().filter(num -> num != null ). |
3 | distinct().mapToInt(num -> num * 2 ). |
4 | peek(System.out::println).skip( 2 ).limit( 4 ).sum()); |
这段代码演示了上面介绍的所有转换方法(除了flatMap),简单解释一下这段代码的含义:给定一个Integer类型的List,获取其对应的Stream对象,然后进行过滤掉null,再去重,再每个元素乘以2,再每个元素被消费的时候打印自身,在跳过前两个元素,最后去前四个元素进行加和运算(解释一大堆,很像废话,因为基本看了方法名就知道要做什么了。这个就是声明式编程的一大好处!)。大家可以参考上面对于每个方法的解释,看看最终的输出是什么。
9. 性能问题
有些细心的同学可能会有这样的疑问:在对于一个Stream进行多次转换操作,每次都对Stream的每个元素进行转换,而且是执行多次,这样时间复杂度就是一个for循环里把所有操作都做掉的N(转换的次数)倍啊。其实不是这样的,转换操作都是lazy的,多个转换操作只会在汇聚操作(见下节)的时候融合起来,一次循环完成。我们可以这样简单的理解,Stream里有个操作函数的集合,每次转换操作就是把转换函数放入这个集合中,在汇聚操作的时候循环Stream对应的集合,然后对每个元素执行所有的函数。
4. 汇聚(Reduce)Stream
在介绍汇聚操作之前,我们先看一下Java doc中对于其定义:
A reduction operation (also called a fold) takes a sequence of input elements and combines them into a single summary result by repeated application of a combining operation, such as finding the sum or maximum of a set of numbers, or accumulating elements into a list. The streams classes have multiple forms of general reduction operations, called reduce() and collect(), as well as multiple specialized reduction forms such as sum(), max(), or count().
简单翻译一下:汇聚操作(也称为折叠)接受一个元素序列为输入,反复使用某个合并操作,把序列中的元素合并成一个汇总的结果。比如查找一个数字列表的总和或者最大值,或者把这些数字累积成一个List对象。Stream接口有一些通用的汇聚操作,比如reduce()和collect();也有一些特定用途的汇聚操作,比如sum(),max()和count()。注意:sum方法不是所有的Stream对象都有的,只有IntStream、LongStream和DoubleStream是实例才有。
下面会分两部分来介绍汇聚操作:
- 可变汇聚:把输入的元素们累积到一个可变的容器中,比如Collection或者StringBuilder;
- 其他汇聚:除去可变汇聚剩下的,一般都不是通过反复修改某个可变对象,而是通过把前一次的汇聚结果当成下一次的入参,反复如此。比如reduce,count,allMatch;
4.1 可变汇聚
可变汇聚对应的只有一个方法:collect,正如其名字显示的,它可以把Stream中的要有元素收集到一个结果容器中(比如Collection)。先看一下最通用的collect方法的定义(还有其他override方法):
1 | <R> R collect(Supplier<R> supplier, |
2 | BiConsumer<R, ? super T> accumulator, |
3 | BiConsumer<R, R> combiner); |
先来看看这三个参数的含义:Supplier supplier是一个工厂函数,用来生成一个新的容器;BiConsumer accumulator也是一个函数,用来把Stream中的元素添加到结果容器中;BiConsumer combiner还是一个函数,用来把中间状态的多个结果容器合并成为一个(并发的时候会用到)。看晕了?来段代码!
1 | List<Integer> nums = Lists.newArrayList( 1 , 1 , null , 2 , 3 , 4 , null , 5 , 6 , 7 , 8 , 9 , 10 ); |
2 | List<Integer> numsWithoutNull = nums.stream().filter(num -> num != null ). |
3 | collect(() -> new ArrayList<Integer>(), |
4 | (list, item) -> list.add(item), |
5 | (list1, list2) -> list1.addAll(list2)); |
上面这段代码就是对一个元素是Integer类型的List,先过滤掉全部的null,然后把剩下的元素收集到一个新的List中。进一步看一下collect方法的三个参数,都是lambda形式的函数(*上面的代码可以使用方法引用来简化,留给读者自己去思考*)。
- 第一个函数生成一个新的ArrayList实例;
- 第二个函数接受两个参数,第一个是前面生成的ArrayList对象,二个是stream中包含的元素,函数体就是把stream中的元素加入ArrayList对象中。第二个函数被反复调用直到原stream的元素被消费完毕;
- 第三个函数也是接受两个参数,这两个都是ArrayList类型的,函数体就是把第二个ArrayList全部加入到第一个中;
但是上面的collect方法调用也有点太复杂了,没关系!我们来看一下collect方法另外一个override的版本,其依赖[Collector](http://docs.oracle.com/javase/8/docs/api/java/util/stream/Collector.html)。
1 | <R, A> R collect(Collector<? super T, A, R> collector); |
这样清爽多了!少年,还有好消息,Java8还给我们提供了Collector的工具类–[Collectors](http://docs.oracle.com/javase/8/docs/api/java/util/stream/Collectors.html),其中已经定义了一些静态工厂方法,比如:Collectors.toCollection()收集到Collection中, Collectors.toList()收集到List中和Collectors.toSet()收集到Set中。这样的静态方法还有很多,这里就不一一介绍了,大家可以直接去看JavaDoc。下面看看使用Collectors对于代码的简化:
1 | List<Integer> numsWithoutNull = nums.stream().filter(num -> num != null ). |
2 | collect(Collectors.toList()); |
4.2 其他汇聚
– reduce方法:reduce方法非常的通用,后面介绍的count,sum等都可以使用其实现。reduce方法有三个override的方法,本文介绍两个最常用的,最后一个留给读者自己学习。先来看reduce方法的第一种形式,其方法定义如下:
1 | Optional<T> reduce(BinaryOperator<T> accumulator); |
接受一个BinaryOperator类型的参数,在使用的时候我们可以用lambda表达式来。
1 | List<Integer> ints = Lists.newArrayList( 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ); |
2 | System.out.println( "ints sum is:" + ints.stream().reduce((sum, item) -> sum + item).get()); |
可以看到reduce方法接受一个函数,这个函数有两个参数,第一个参数是上次函数执行的返回值(也称为中间结果),第二个参数是stream中的元素,这个函数把这两个值相加,得到的和会被赋值给下次执行这个函数的第一个参数。要注意的是:**第一次执行的时候第一个参数的值是Stream的第一个元素,第二个参数是Stream的第二个元素**。这个方法返回值类型是Optional,这是Java8防止出现NPE的一种可行方法,后面的文章会详细介绍,这里就简单的认为是一个容器,其中可能会包含0个或者1个对象。
这个过程可视化的结果如图:
reduce方法还有一个很常用的变种:
1 | T reduce(T identity, BinaryOperator<T> accumulator); |
这个定义上上面已经介绍过的基本一致,不同的是:它允许用户提供一个循环计算的初始值,如果Stream为空,就直接返回该值。而且这个方法不会返回Optional,因为其不会出现null值。下面直接给出例子,就不再做说明了。
1 | List<Integer> ints = Lists.newArrayList( 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ); |
2 | System.out.println( "ints sum is:" + ints.stream().reduce( 0 , (sum, item) -> sum + item)); |
– count方法:获取Stream中元素的个数。比较简单,这里就直接给出例子,不做解释了。
1 | List<Integer> ints = Lists.newArrayList( 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ); |
2 | System.out.println( "ints sum is:" + ints.stream().count()); |
– 搜索相关
– allMatch:是不是Stream中的所有元素都满足给定的匹配条件
– anyMatch:Stream中是否存在任何一个元素满足匹配条件
– findFirst: 返回Stream中的第一个元素,如果Stream为空,返回空Optional
– noneMatch:是不是Stream中的所有元素都不满足给定的匹配条件
– max和min:使用给定的比较器(Operator),返回Stream中的最大|最小值
下面给出allMatch和max的例子,剩下的方法读者当成练习。
1 | List<Integer> ints = Lists.newArrayList( 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ); |
2 | System.out.println(ints.stream().allMatch(item -> item < 100 )); |
3 | ints.stream().max((o1, o2) -> o1.compareTo(o2)).ifPresent(System.out::println); |