flink中使用lambda表达式


java8中有一种新的语法糖,即 lambda表达式,在 flink中,支持对所有的java api提供了 lambda的支持,但是存在一些限制,此处举一个例子,来说明如何在 flink中使用 lambda表达式,以及出错后如何处理。

参考链接:https://ci.apache.org/projects/flink/flink-docs-stable/dev/java_lambdas.html

1、使用lambda的一个示例

/**
 * 测试 lambda 表达式在 flink 中的应用
 * 不建议使用 lambda 表达式
 * <p>
 * 参考文章:https://ci.apache.org/projects/flink/flink-docs-stable/dev/java_lambdas.html
 *
 * @author huan.fu
 * @date 2019-11-17 - 13:57
 */
public class FlinkLambdaJob {
    public static void main(String[] args) throws Exception {
        ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment();
        List<String> datas = Arrays.asList("aa,bb,ccc,dd,aa", "cc,dd,ee,ff,gg,aa");
        DataSource<String> dataSource = env.fromCollection(datas);
        dataSource.flatMap((String input, Collector<String[]> collector) -> {
                        collector.collect(input.split(","));
                    })
                    .flatMap((String[] words, Collector<Tuple2<String, Integer>> collector) -> {
                        Arrays.stream(words).map(word -> new Tuple2<>(word, 1)).forEach(collector::collect);
                    })
                    .groupBy(0)
                    .sum(1)
                    .print();
    }
}

2、使用上面这种写法通常或得到如下错误

Exception in thread "main" org.apache.flink.api.common.functions.InvalidTypesException: The return type of function 'main(FlinkLambdaJob.java:26)' could not be determined automatically, due to type erasure. You can give type information hints by using the returns(...) method on the result of the transformation call, or by letting your function implement the 'ResultTypeQueryable' interface.
	at org.apache.flink.api.java.DataSet.getType(DataSet.java:178)
	at org.apache.flink.api.java.DataSet.flatMap(DataSet.java:266)
	at com.huan.study.flink.lambda.FlinkLambdaJob.main(FlinkLambdaJob.java:29)
Caused by: org.apache.flink.api.common.functions.InvalidTypesException: The generic type parameters of 'Collector' are missing. In many cases lambda methods don't provide enough information for automatic type extraction when Java generics are involved. An easy workaround is to use an (anonymous) class instead that implements the 'org.apache.flink.api.common.functions.FlatMapFunction' interface. Otherwise the type has to be specified explicitly using type information.
	at org.apache.flink.api.java.typeutils.TypeExtractionUtils.validateLambdaType(TypeExtractionUtils.java:350)
	at org.apache.flink.api.java.typeutils.TypeExtractionUtils.extractTypeFromLambda(TypeExtractionUtils.java:176)
	at org.apache.flink.api.java.typeutils.TypeExtractor.getUnaryOperatorReturnType(TypeExtractor.java:571)
	at org.apache.flink.api.java.typeutils.TypeExtractor.getFlatMapReturnTypes(TypeExtractor.java:196)
	at org.apache.flink.api.java.DataSet.flatMap(DataSet.java:266)
	at com.huan.study.flink.lambda.FlinkLambdaJob.main(FlinkLambdaJob.java:26)

3、解决方案

默认情况下,flink可以从方法签名中获取范型信息,但是 void flatMap(IN value, Collector<OUT> out)javac编译后,会变成 void flatMap(IN value, Collector out),导致范型丢失,导致flink无法自动推断出类型,flink会认为是Object类型,从而导致无效的序列化类型。

有了以上认识,我们可以提供如下解决方案

1、使用 匿名函数 来替代lambda表达式
2、从报错信息中,我们知道需要使用 returns方法来明确的指定返回类型

修改后的代码,此处使用 returns 方法来实现
flink中lambda明确指定返回类型

4、建议

虽然使用 lambda表达式,在flink中代码变简洁了,但是需要增加额外的returns方法来明确的指定返回值类型,因此建议在flink中尽量少使用lambda表达式,可以使用匿名类来代替。不过这也看个人的习惯。

5、完整代码

https://gitee.com/huan1993/flink-parent/blob/master/flink-lambda/src/main/java/com/huan/study/flink/lambda/FlinkLambdaJob.java

  • 6
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值