java stream api

最新推荐文章于 2024-07-09 16:49:59 发布

那么烦

最新推荐文章于 2024-07-09 16:49:59 发布

阅读量267

点赞数

分类专栏： java 文章标签： java 开发语言后端

原文链接：https://iflow.uc.cn/webview/news?app=uc-iflow&aid=6836154097629720045&cid=100&zzd_from=uc-iflow&recoid=&rd_type=share&sp_gz=0&pagetype=share&btifl=100&uc_share_depth=1&uc_param_str=dndsfrvesvntnwpfgipc

版权

java 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

面试官：java8新增的streamapi用过吗？

我：这个必须用过啊。

面试官：给你下面一个字符串数组,如果用streamapi来实现，找出以字符'a'开头的字符串最大长度，使用streamapi该怎么实现呢？

我：用下面这个方法来实现：

publicstaticvoidmaxLength(Listlist){

System.out.println(list.stream.filter(s->s.startsWith("a")).mapToInt(r->length(r)).max.orElse(0));;

}

面试官：这个操作是迭代一次还是迭代两次呢？也就是说是先迭代一遍，过滤出以字符'a'开头的字符串数组，然后再迭代一次，找出最大长度，还是一次迭代完成呢？

我:这个是迭代一次完成，如果要是迭代多次，stream后面的操作函数很多的情况下效率会非常低。我们加个打印可以来验证结果，代码如下：

publicstaticvoidmain(String[]args){

Listlist=Arrays.asList("abb","abcd","fegc","efe","adfes");

intmaxLength=list.stream.

filter(s->isStartWitha(s)).

mapToInt(StreamTest1::length).

max.orElse(0);

System.out.println("以字符a开头的字符串最大长度:"+maxLength);

}

privatestaticbooleanisStartWitha(Stringa){

System.out.println(a+"isstartwitha："+a.startsWith("a"));

returna.startsWith("a");

}

privatestaticintlength(Stringa){

System.out.println("thelengthof"+a+":"+a.length);

returna.length;

}

打印结果如下：

abbisstartwitha：true

thelengthofabb:3

abcdisstartwitha：true

thelengthofabcd:4

fegcisstartwitha：false

efeisstartwitha：false

adfesisstartwitha：true

thelengthofadfes:5

以字符a开头的字符串最大长度:5

面试官：你确定只是迭代一次吗？有其他情况吗？

我：有。filter是一个无状态的中间操作，对于这个中间操作来说，stream处理只需要迭代一次。但是对于有状态的中间操作，就需要迭代多次。

面试官：你刚刚提到有状态的操作和无状态的操作，这个是怎么区分呢?

我：在streamapi中，无状态的操作是指当前元素的操作不受前面元素的影响，主要包括如下方法：

filter,flatMap,flatMapToInt,flatMapToLong,flatMapToDouble,map,mapToInt,mapToDouble,mapToLong,peek,unordered

而有状态的操作是指需要等所有元素处理完之后才能执行当前操作，主要包括下面方法：

distinct,limit,skip,sorted,sorted

面试官：有状态的操作，能举个例子吗？

我：比如下面这段代码：

publicstaticvoidmain(String[]args){

Listlist=Arrays.asList(5,2,3,1,4);

ListnewArray=list.stream

.map(StreamTest2::map1)

.sorted((o1,o2)->o1-o2)

.map(StreamTest2::map2)

.collect(Collectors.toList);

System.out.println("新的有序数组:"+newArray);

}

privatestaticIntegermap1(Integeri){

intresult=i*10;

System.out.println("线程:"+Thread.currentThread.getName+"方法map1入参："+i+",输出:"+result);

returnresult;

}

privatestaticIntegermap2(Integeri){

intresult=i*10;

System.out.println("线程:"+Thread.currentThread.getName+"方法map2入参："+i+",输出:"+result);

returnresult;

}

上面代码中，对原始数组进行了两次迭代，第一次迭代对所有数组元素都调用了map1方法乘以10，然后对新数组进行排序，第二次迭代对排序后的数组元素调用map2方法，即对排序后的数组元素乘以10。方法输出如下：

线程:main方法map1入参：5,输出:50

线程:main方法map1入参：2,输出:20

线程:main方法map1入参：3,输出:30

线程:main方法map1入参：1,输出:10

线程:main方法map1入参：4,输出:40

线程:main方法map2入参：10,输出:100

线程:main方法map2入参：20,输出:200

线程:main方法map2入参：30,输出:300

线程:main方法map2入参：40,输出:400

线程:main方法map2入参：50,输出:500

新的有序数组:[100,200,300,400,500]

面试官：了解过底层原理吗？

我：我来先画一下Stream的UML类图：

这个类图说明以下几点：

AbstractPipeline有基本类型的子类，如LongPipeline和DoublePipeline，还有一个引用类型的子类ReferencePipeline。

无论是ReferencePipeline，还是LongPipeline和DoublePipeline等基本类型的Pipeline，都有3个内部类都继承自己。

StatelessOp对应无状态的操作，StatefulOp对应有状态的操作，Head对应Collection.stream返回结果。

无论是StatelessOp、StatefulOp还是Head，都是一个Pipeline，这些Pipeline用双向链表串联起来，每个Pipeline节点被看作一个Stage，Head是链表的头结点。上面UML类图中AbstractPipeline类中previousStage和nextStage就代表双向链表当前节点指向前后节点的引用。如下图：

面试官：上面用双向链表把所有操作都串联起来了，这样可以实现从Head节点开始依次执行所有的操作。但是这些操作怎么叠加在一起呢？比如下面这段代码有三个map方法，后面的方法要依赖前面的计算结果：

Listlist=Arrays.asList(5,2,3,1,4);

ListnewArray=list.stream.map(StreamTest2::map1).map(StreamTest2::map2).map(StreamTest2::map3).collect(Collectors.toList);

我：Stream提供了Sink接口来处理操作的叠加。上面代码的map方法把操作封装到了Sink，每个节点执行操作时，调用Sink的accept方法就可以把操作结果传给下一个节点的Sink。map方法源代码如下：

publicfinalStreammap(Functionmapper){

Objects.requireNonNull(mapper);

returnnewStatelessOp(this,StreamShape.REFERENCE,

StreamOpFlag.NOT_SORTED|StreamOpFlag.NOT_DISTINCT){

@Override

//返回包装成的Sink

SinkopWrapSink(intflags,Sinksink){

returnnewSink.ChainedReference(sink){

@Override

publicvoidaccept(P_OUTu){

//downstream是下游节点的Sink，把当前节点的执行结果传给下游节点

downstream.accept(mapper.apply(u));

}

};

}

};

}

面试官：能详细讲一下Sink吗？

我：Sink主要提供了下面4个方法

//执行操作之前调用这个方法

voidbegin(longsize)

//执行操作之后调用这个方法

voidend

//是否可以结束操作

booleancancellationRequested

//操作执行函数

voidaccept

面试官：那cancellationRequested方法什么时候用呢？

我：这个方法用于短路操作，比如stream.findAny。

面试官：你刚刚提到短路操作，怎么区分短路操作和非短路操作呢？

我：短路操作和非短路操作都是Stream的结束操作，结束操作是针对中间操作来说的。短路操作是指不用处理全部元素就可以结束，包括下面的方法：

anyMatch,allMatch,noneMatch,findFirst,findAny

非短路操作是指需要处理所有元素才能结束，包括下面的方法：

forEach,forEachOrdered,toArray,reduce,collect,max,min,count

总结一下Stream操作，如下图：

在遇到结束操作时，所有Pipeline节点封装的Sink会串成一个链表，如下图：

把Sink串成链表的过程可以参考下面这段源代码：

finalSinkwrapSink(Sinksink){

Objects.requireNonNull(sink);

for(@SuppressWarnings("rawtypes")AbstractPipelinep=AbstractPipeline.this;p.depth>0;p=p.previousStage){

sink=p.opWrapSink(p.previousStage.combinedFlags,sink);

}

return(Sink)sink;

}

这样从Head节点开始依次调用每个节点封装的Sink中的begin,accept,cancellationRequested,end四个方法就可以完成Steam流水线的执行。

面试官：上面提到了Sink会串成一个链，那对于有返回结果的操作，返回的结果是保存在什么地方呢？

我：这里分三种情况：

如果返回结果是boolean(比如anyMatch、allMatch、noneMatch)和Optional(比如findFirst、findAny)，返回结果存放在对应的Sink。

collect,reduce等规约操作，返回结果存放在用户指定的容器中，比如如下代码返回结果放在Optional容器中：

OptionalaccResult=Stream.of(1,2,3,4,5).reduce((sum,item)->{

sum+=item;

returnsum;

});

对于返回是数组的情况，返回数组之前，数据会存放在一种多叉树数据结构中，这种多叉树结构元素存储在树的叶子当中，一个叶子节点可以存放多个元素。

面试官：上面你提到返回数组的时候用到了多叉树的结构，这样做对于Stream处理有什么好处呢？

我：按照官方的说法，这样做是为了避免在并行操作期间不必要地复制数据。

面试官：能简单介绍一下Stream的并行处理吗？

我：Stream的并行处理用到了Fork/Join框架，如下图：

计算过程中，先把任务拆解成子任务，并行计算。计算完成后再把子任务计算结果合并成结果集。

面试官：Fork/Join框架跟普通线程池相比，有什么优势吗？

我：fork/join框架的优势是,如果某个子任务需要等待另外一个子任务完成才能继续工作，那么处理线程会主动寻找其他未完成的子任务进行执行。跟普通线程池相比，减少了等待时间。

面试官：使用Stream并行流，一定会比串行快吗？

我：这个不一定，使用的时候要考虑以下几个因素：

要处理的元素数量，数据越多，性能提升越明显

数据结构的可分割性，数组、ArrayList支持随机读取，可分割性好，HashSet、TreeSet虽然可以分割，但不太容易分割均匀，LinkedList、Streams.iterate、BufferedReader.lines因为长度未知，可分解性差。

尽量使用基本类型，避免装箱拆箱。

单个子任务花费时间越长，带来的性能提升就会越大。

面试官：据说Streamapi跟普通迭代相比有性能损耗，你怎么看？

我：对于简单的处理操作，Streamapi性能确实不如普通迭代。但是如果CPU性能好的话，使用Stream并行处理性能会明细提高。对于复杂处理操作，无论并行还是串行，Streamapi有明显的优势。

那么烦

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
java stream api

面试官：java8新增的streamapi用过吗？我：这个必须用过啊。面试官：给你下面一个字符串数组,如果用streamapi来实现，找出以字符'a'开头的字符串最大长度，使用streamapi该怎么实现呢？我：用下面这个方法来实现：publicstaticvoidmaxLength(Listlist){System.out.println(list.stream.filter(s->s.startsWith("a")).mapToInt(r->length(r)).max.
复制链接

扫一扫

专栏目录