stream API

1. 什么是stream

        Stream 不是集合元素,它不是数据结构并不保存数据,它是有关算法和计算的,它更像一个高级版本的 Iterator。原始版本的 Iterator,用户只能显式地一个一个遍历元素并对其执行某些操作;高级版本的 Stream,用户只要给出需要对其包含的元素执行什么操作,比如 “过滤掉长度大于 10 的字符串”、“获取每个字符串的首字母”等,Stream 会隐式地在内部进行遍历,做出相应的数据转换。
        Stream 就如同一个迭代器(Iterator),单向,不可往复,数据只能遍历一次,遍历过一次后即用尽了,就好比流水从面前流过,一去不复返。
        而和迭代器又不同的是,Stream 可以并行化操作,迭代器只能命令式地、串行化操作。顾名思义,当使用串行方式去遍历时,每个 item 读完后再读下一个 item。而使用并行去遍历时,数据会被分成多个段,其中每一个都在不同的线程中处理,然后将结果一起输出。Stream 的并行操作依赖于 Java7 中引入的 Fork/Join 框架(JSR166y)来拆分任务和加速处理过程。

2. 为什么需要stream

        Stream 作为 Java 8 的一大亮点,它与 java.io 包里的 InputStream 和 OutputStream 是完全不同的概念。
        Java 8 中的 Stream 是对集合(Collection)对象功能的增强,它专注于对集合对象进行各种非常便利、高效的聚合操作(aggregate operation),或者大批量数据操作 (bulk data operation)。尤其是对于数据从业人员来说,对数据做各种操作转换是再正常不过的需求,基本每天都会用到。例如下面这么一个简单的小需求:求一个集合中字符串长度小于5的数量。
        在java8之前,我们一般这么做:

    @Test
    public void lenIter() {
        List<String> list = Arrays.asList("java", "scala", "python", "shell", "ruby");
        int num = 0;
        for(String lan: list) {
            if(lan.length() < 5) {
                num++;
            }
        }
        System.out.println(num);
    }

这段代码逻辑很简单,但是显得很冗长,可读性嘛也就呵呵了。如果用Stream,我们可以这样:

    @Test
    public void lenStream() {
        List<String> list = Arrays.asList("java", "scala", "python", "shell", "ruby");
        long num = list.parallelStream().filter(x -> x.length() < 5).count();
        System.out.println(num);
    }

代码量明显减少而且逻辑特别清楚,即使不懂代码的人看到也能猜出来是什么意思。如果大家了解过函数式编程,就会觉得特别亲切自然。

3. stream和其它集合具体的区别

  1. 不存储数据 。流是基于数据源的对象,它本身不存储数据元素,而是通过管道将数据源的元素传递给操作。
  2. 函数式编程 。流的操作不会修改数据源,例如filter不会将数据源中的数据删除。
  3. 延迟操作 。流的很多操作如filter,map等中间操作是延迟执行的,只有到终点操作才会将操作顺序执行。
  4. 可以解绑 。对于无限数量的流,有些操作是可以在有限的时间完成的,比如limit(n)或findFirst(),这些操作可是实现”短路”(Short-circuiting),访问到有限的元素后就可以返回。
  5. 纯消费 。流的元素只能访问一次,类似Iterator,操作没有回头路,如果你想从头重新访问流的元素,对不起,你得重新生成一个新的流。

流的操作是以管道的方式串起来的。流管道包含一个数据源,接着包含零到N个中间操作,最后以一个终点操作结束。

4. stream语法

【原文】https://www.cnblogs.com/aoeiuv/p/5911692.html

List<Integer> nums = Lists.newArrayList(1,null,3,4,null,6);
nums.stream().filter(num -> num != null).count();

        上面这段代码是获取一个List中,元素不为null的个数。这段代码虽然很简短,但是却是一个很好的入门级别的例子来体现如何使用Stream,正所谓“麻雀虽小五脏俱全”。我们现在开始深入解刨这个例子,完成以后你可能可以基本掌握Stream的用法!
在这里插入图片描述
        图片就是对于Stream例子的一个解析,可以很清楚的看见:原本一条语句被三种颜色的框分割成了三个部分。红色框中的语句是一个Stream的生命开始的地方,负责创建一个Stream实例;绿色框中的语句是赋予Stream灵魂的地方,把一个Stream转换成另外一个Stream,红框的语句生成的是一个包含所有nums变量的Stream,进过绿框的filter方法以后,重新生成了一个过滤掉原nums列表所有null以后的Stream;蓝色框中的语句是丰收的地方,把Stream的里面包含的内容按照某种算法来汇聚成一个值,例子中是获取Stream中包含的元素个数。如果这样解析以后,还不理解,那就只能动用“核武器”–图形化,一图抵千言!
在这里插入图片描述
使用Stream的基本步骤:

1.创建Stream;
2.转换Stream,每次转换原有Stream对象不改变,返回一个新的Stream对象(可以有多次转换);
3.对Stream进行聚合(Reduce)操作,获取想要的结果;

4.1 怎么得到stream

最常用的创建Stream有两种途径:

  • 通过Stream接口的静态工厂方法(注意:Java8里接口可以带静态方法);
  • 通过Collection接口的默认方法(默认方法:Default method,也是Java8中的一个新特性,就是接口中的一个带有实现的方法)–stream(),把一个Collection对象转换成Stream

4.1.1 使用Stream静态方法来创建Stream

  • of方法:有两个overload方法,一个接受变长参数,一个接受单一值
	Stream<Integer> integerStream = Stream.of(1, 2, 3, 5);
	Stream<String> stringStream = Stream.of("taobao");
  • generator方法:生成一个无限长度的Stream,其元素的生成是通过给定的Supplier(这个接口可以看成一个对象的工厂,每次调用返回一个给定类型的对象)
	Stream.generate(new Supplier<Double>() {
	    @Override
	    public Double get() {
	         return Math.random();
	    }
	});
	Stream.generate(() -> Math.random());
	Stream.generate(Math::random);

        三条语句的作用都是一样的,只是使用了lambda表达式和方法引用的语法来简化代码。每条语句其实都是生成一个无限长度的Stream,其中值是随机的。这个无限长度Stream是懒加载,一般这种无限长度的Stream都会配合Stream的limit()方法来用。

  • iterate方法:也是生成无限长度的Stream,和generator不同的是,其元素的生成是重复对给定的种子值(seed)调用用户指定函数来生成的。其中包含的元素可以认为是:seed,f(seed),f(f(seed))无限循环
Stream.iterate(1, item -> item + 1).limit(10).forEach(System.out::println);

        这段代码就是先获取一个无限长度的正整数集合的Stream,然后取出前10个打印。千万记住使用limit方法,不然会无限打印下去。

4.1.2 通过Collection子类获取Stream

Collection接口有一个stream方法,所以其所有子类都都可以获取对应的Stream对象

	public interface Collection<E> extends Iterable<E> {
	      //其他方法省略
	     default Stream<E> stream() {
	          return StreamSupport.stream(spliterator(), false);
	     }
	}

4.2 转换stream

转换Stream其实就是把一个Stream通过某些行为转换成一个新的Stream。Stream接口中定义了几个常用的转换方法,下面我们挑选几个常用的转换方法来解释。

4.2.1 distinct:()

        对于Stream中包含的元素进行去重操作(去重逻辑依赖元素的equals方法),新生成的Stream中没有重复的元素
在这里插入图片描述

	List<Person> result = list.stream().distinct().collect(toList());

4.2.2 filter()

        filter函数接收一个Lambda表达式作为参数,该表达式返回boolean,在执行过程中,流将元素逐一输送给filter,并筛选出执行结果为true的元素
在这里插入图片描述

	//筛选出所有学生
	List<Person> result = list.stream().filter(Person::isStudent) .collect(toList());

4.2.3 map()

        对stream中的每个元素执行一个函数,使得元素转换成另一种类型输出。流会将每一个元素输送给map函数,并执行map中的Lambda表达式,最后将执行结果存入一个新的流中。
        这个方法有三个对于原始类型的变种方法,分别是:mapToIntmapToLongmapToDouble。这三个方法也比较好理解,比如mapToInt就是把原始Stream转换成一个新的Stream,这个新生成的Stream中的元素都是int类型。之所以会有这样三个变种方法,可以免除自动装箱/拆箱的额外消耗
在这里插入图片描述

	//获取每个人的姓名(实则是将Perosn类型转换成String类型)
	List<Person> result = list.stream().map(Person::getName).collect(toList());

4.2.4 flatMap()

        和map类似,不同的是其每个元素转换得到的是Stream对象,会把子Stream中的元素压缩到父集合中。说白了,就是元素都是容器类型的,flatMap把他们一个个转成stream,然后合并为一个stream,这样最后返回的容器包含的元素就都是单一对象 ,原来的小容器全都去掉了
在这里插入图片描述
        flatMap给一段代码理解:

	Stream<List<Integer>> inputStream = Stream.of(
		 Arrays.asList(1),
		 Arrays.asList(2, 3),
		 Arrays.asList(4, 5, 6)
	 );
	Stream<Integer> outputStream = inputStream.flatMap((childList) -> childList.stream());

        flatMap 把 inputStream 中的层级结构扁平化,就是将最底层元素抽出来放到一起,最终 output 的新 Stream 里面已经没有 List 了,都是直接的数字。

4.2.5 peek()

        生成一个包含原Stream的所有元素的新Stream,同时会提供一个消费函数(Consumer实例),新Stream每个元素被消费的时候都会执行给定的消费函数
在这里插入图片描述

4.2.6 limit()

        对一个Stream进行截断操作,获取其前N个元素,如果原Stream中包含的元素个数小于N,那就获取其所有的元素
在这里插入图片描述

	List<Person> result = list.stream().limit(4).collect(toList());

4.2.7 skip()

        返回一个丢弃原Stream的前N个元素后剩下元素组成的新Stream,如果原Stream中包含的元素个数小于N,那么返回空Stream
在这里插入图片描述

	List<Person> result = list.stream().skip(4).collect(toList());

综合示例

import java.util.Arrays;
import java.util.List;

public class Test {
	public static void main(String[] args) {
		Integer[] a = { 1, 1, null, 2, 3, 4, null, 5, 6, 7, 8, 9, 10 };
		List<Integer> nums = Arrays.asList(a);
		System.out.println("sum is:" + nums.stream().filter(num -> num != null)
				.distinct().mapToInt(num -> num * 2)
				.peek(System.out::println).skip(2).limit(4).sum());
	}
}

        这段代码演示了上面介绍的所有转换方法(除了flatMap),简单解释一下这段代码的含义:给定一个Integer类型的List,获取其对应的Stream对象,然后进行过滤掉null,再去重,再每个元素乘以2,再每个元素被消费的时候打印自身,再跳过前两个元素,最后取前四个元素进行求和运算(解释一大堆,很像废话,因为基本看了方法名就知道要做什么了。这个就是声明式编程的一大好处!)。大家可以参考上面对于每个方法的解释,看看最终的输出是什么。
在这里插入图片描述
        可能会有这样的疑问:在对于一个Stream进行多次转换操作,每次都对Stream的每个元素进行转换,而且是执行多次,这样时间复杂度就是一个for循环里把所有操作都做掉的N(转换的次数)倍啊。其实不是这样的,转换操作都是lazy的,多个转换操作只会在汇聚操作(见下节)的时候融合起来,一次循环完成。我们可以这样简单的理解:Stream里有个操作函数的集合,每次转换操作就是把转换函数放入这个集合中,在汇聚操作的时候循环Stream对应的集合,然后对每个元素执行所有的函数

4.3 汇聚(Reduce)Stream

        汇聚操作(也称为折叠接受一个元素序列为输入,反复使用某个合并操作,把序列中的元素合并成一个汇总的结果。比如查找一个数字列表的总和或者最大值,或者把这些数字累积成一个List对象。Stream接口有一些通用的汇聚操作,比如reduce()和collect();也有一些特定用途的汇聚操作,比如sum(),max()和count()。注意:sum方法不是所有的Stream对象都有的,只有IntStream、LongStream和DoubleStream是实例才有。
下面会分两部分来介绍汇聚操作:

  • 可变汇聚:把输入的元素们累积到一个可变的容器中,比如Collection或者StringBuilder;
  • 其他汇聚:除去可变汇聚剩下的,一般都不是通过反复修改某个可变对象,而是通过把前一次的汇聚结果当成下一次的入参,反复如此。比如reduce,count,allMatch;

4.3.1 可变汇聚

        可变汇聚对应的只有一个方法:collect,正如其名字显示的,它可以把Stream中的要有元素收集到一个结果容器中(比如Collection)。先看一下最通用的collect方法的定义(还有其他override方法):

	<R> R collect(Supplier<R> supplier,BiConsumer<R, ? super T> accumulator,BiConsumer<R, R> combiner);

        先来看看这三个参数的含义:Supplier supplier是一个工厂函数用来生成一个新的容器BiConsumer accumulator也是一个函数,用来把Stream中的元素添加到结果容器中BiConsumer combiner还是一个函数,用来把中间状态的多个结果容器合并成为一个(并发的时候会用到)

                        看晕了?来段代码!

import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

public class Test {
	public static void main(String[] args) {

		List<Integer> nums = Arrays.asList(1, 1, null, 2, 3, 4, null, 5, 6, 7, 8, 9, 10);
		List<Integer> numsWithoutNull = nums.stream().filter(num -> num != null).collect(
			() -> new ArrayList<Integer>(),
			(list, item) -> list.add(item),
			(list1, list2) -> list1.addAll(list2)
		);
	}
}

        上面这段代码就是对一个元素是Integer类型的List,先过滤掉全部的null,然后把剩下的元素收集到一个新的List中。进一步看一下collect方法的三个参数,都是lambda形式的函数。

  • 第一个函数生成一个新的ArrayList实例
  • 第二个函数接受两个参数,第一个是前面生成的ArrayList对象,第二个是stream中包含的元素,函数体就是把stream中的元素加入ArrayList对象中。第二个函数被反复调用直到原stream的元素被消费完毕
  • 第三个函数也是接受两个参数,这两个都是ArrayList类型的,函数体就是把第二个ArrayList全部加入到第一个中

但是上面的collect方法调用也有点太复杂了,没关系!我们来看一下collect方法另外一个override的版本,其依赖Collector

	<R, A> R collect(Collector<? super T, A, R> collector);

这样清爽多了!Java8还给我们提供了Collector的工具类–Collectors,其中已经定义了一些静态工厂方法,比如:

    Collectors.toCollection()	//收集到Collection中
    Collectors.toList()			//收集到List中
    Collectors.toSet()			//收集到Set中

这样的静态方法还有很多,这里就不一一介绍了,大家可以直接去看JavaDoc。下面看看使用Collectors对于代码的简化:

	List<Integer> nums = Arrays.asList(1, 1, null, 2, 3, 4, null, 5, 6, 7, 8, 9, 10);
	List<Integer> numsWithoutNull = nums.stream().filter(num -> num != null).collect(Collectors.toList());

4.3.2 其他汇聚

4.3.2.1 reduce方法

        reduce方法非常的通用,后面介绍的count,sum等都可以使用其实现。reduce方法有三个override的方法,本文介绍两个最常用的.

  • Optional reduce(BinaryOperator accumulator);
    接受一个BinaryOperator类型的参数,在使用的时候我们可以用lambda表达式。
	List<Integer> ints = Arrays.asList(1,2,3,4,5,6,7,8,9,10);
	System.out.println("ints sum is:" + ints.stream().reduce((sum, item) -> sum + item).get());

        可以看到reduce方法接受一个函数,这个函数有两个参数,第一个参数是上次函数执行的返回值(也称为中间结果),第二个参数是stream中的元素,这个函数把这两个值相加,得到的和会被赋值给下次执行这个函数的第一个参数。
        要注意的是:第一次执行的时候第一个参数的值是Stream的第一个元素,第二个参数是Stream的第二个元素。这个方法返回值类型是Optional,这是Java8防止出现NullPointerException的一种可行方法,后面的文章会详细介绍,这里就简单的认为是一个容器,其中可能会包含0个或者1个对象。
        这个过程可视化的结果如图:
在这里插入图片描述

  • T reduce(T identity, BinaryOperator accumulator);
    这个定义上上面已经介绍过的基本一致,不同的是:它允许用户提供一个循环计算的初始值,如果Stream为空,就直接返回该值。而且这个方法不会返回Optional,因为其不会出现null值
	List<Integer> ints = Arrays.asList(1,2,3,4,5,6,7,8,9,10);
	System.out.println("ints sum is:" + ints.stream().reduce(0, (sum, item) -> sum + item));
4.3.2.2 count方法

        获取Stream中元素的个数

	List<Integer> ints = Arrays.asList(1,2,3,4,5,6,7,8,9,10);
	System.out.println("ints sum is:" + ints.stream().count());
4.3.2.3 allMatch方法

        allMatch用于判断流中的所有元素是否都满足指定条件,这个判断条件通过Lambda表达式传递给allMatch,执行结果为boolean类型。

	List<Integer> ints = Arrays.asList(1,2,3,4,5,6,7,8,9,10);
	System.out.println(ints.stream().allMatch(item -> item < 100)); //true
4.3.2.4 anyMatch方法

        anyMatch用于判断流中是否存在至少一个元素满足指定的条件,这个判断条件通过Lambda表达式传递给anyMatch,执行结果为boolean类型。

	List<Integer> ints = Arrays.asList(1,2,3,4,5,6,7,8,9,10);
	System.out.println(ints.stream().anyMatch(item -> item > 100)); //false
	System.out.println(ints.stream().anyMatch(item -> item > 9)); //true
4.3.2.5 noneMatch方法

        noneMatch与allMatch恰恰相反,它用于判断流中的所有元素是否都不满足指定条件

	List<Integer> ints = Arrays.asList(1,2,3,4,5,6,7,8,9,10);
	System.out.println(ints.stream().noneMatch(item -> item > 100)); //true
	System.out.println(ints.stream().noneMatch(item -> item > 9)); //false
4.3.2.6 Optional介绍

        Optional是Java8新加入的一个容器,这个容器只存1个或0个元素,它用于防止出现NullpointException,它提供如下方法:

  • isPresent()
    判断容器中是否有值
  • ifPresent(Consume lambda)
    容器若不为空则执行括号中的Lambda表达式
  • T get()
    获取容器中的元素,若容器为空则抛出NoSuchElement异常
  • T orElse(T other)
    获取容器中的元素,若容器为空则返回括号中的默认值
4.3.2.7 findFirst方法

        获取第一个元素

	Optional<Person> person = list.stream().findFirst();
4.3.2.8 max方法和min方法

        使用给定的比较器(Operator),返回Stream中的最大or最小值

	List<Integer> ints = Arrays.asList(11,2,3,4,5,6,7,8,9,10);
	ints.stream().max((o1, o2) -> o1.compareTo(o2)).ifPresent(System.out::println); //11
	ints.stream().min((o1, o2) -> o1.compareTo(o2)).ifPresent(System.out::println); //2
4.3.2.9 forEach方法

        forEach 方法接收一个 Lambda 表达式,然后在 Stream 的每一个元素上执行该表达式

import java.util.Arrays;
import java.util.List;

public class Test {
	public static void main(String[] args) {
		List<Integer> ints = Arrays.asList(11, 2, 3, 4, 5, 6, 7, 8, 9, 10);
		ints.stream().filter(p -> p > 5).forEach(System.out::println);
	}
}

在这里插入图片描述

4.2.3.10 sorted方法

        对 Stream 的排序通过 sorted 进行,它比数组的排序更强之处在于你可以首先对 Stream 进行各类 map、filter、limit、skip 甚至 distinct 来减少元素数量后,再排序,这能帮助程序明显缩短执行时间

import java.util.Arrays;
import java.util.List;

public class Test {
	public static void main(String[] args) {
		List<Integer> ints = Arrays.asList(11, 2, 3, 4, 5, 6, 7, 8, 9, 10);
		ints.stream().filter(p -> p > 5).sorted().forEach(System.out::println);
	}
}

在这里插入图片描述
        sorted方法还可以传入比较规则

	//函数原型
	Stream<T> sorted(Comparator<? super T> comparator);

例如,上面的是默认升序,我传入一个comparator让它降序

import java.util.Arrays;
import java.util.List;

public class Test {
	public static void main(String[] args) {
		List<Integer> ints = Arrays.asList(11, 2, 3, 4, 5, 6, 7, 8, 9, 10);
		ints.stream().filter(p -> p > 5).sorted((p,q)->q-p).forEach(System.out::println);
	}
}

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值