背景:利用java 8的lambda新特性,写flink可以简化一部分代码, 写一些类似于map,fliter,keyby 操作非常方便方便,只需要定义一个匿名函数,得到一个返回值, flatMap 操作时没有返回值的,通过Collector将数据进行输出到下一个算子。
flatMap算子
需要自己去实现方法FlatMapFunction<in,out> 定义输入输出参数类型,重写flatMap方法,将数据通过Collector进行输出
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
DataStreamSource<String> stringDataStreamSource = env.readTextFile("D:\\work\\file\\demo.txt");
stringDataStreamSource.flatMap(new FlatMapFunction<String, String>() {
@Override
public void flatMap(String value, Collector<String> out) throws Exception {
String[] split = value.split(" ");
for (String s : split) {
out.collect(s);
}
}
}).print();
env.execute();
使用lambda表达式方式
这里定义了一个匿名函数,定义了两个参数,输入类型,和输出的收集器类型, 之后遍历类型将结果输出, 这里最后需要单独定义返回参数类型,需要再后面接一个方法returns
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
DataStreamSource<String> stringDataStreamSource = env.readTextFile("D:\\work\\file\\demo.txt");
stringDataStreamSource.flatMap((String a, Collector<String> out) -> Arrays.stream(a.split(" ")).forEach(x -> out.collect(x)))
.returns(String.class).print();
env.execute();
个人感觉代码确实简洁了一些,看个人喜欢了