【Flink】Flink中的泛型擦除问题

匿名函数( Lambda 表达式)是 Java 8 引入的新特性,方便我们更加快速清晰地写代码。
Lambda 表达式允许以简洁的方式实现函数,以及将函数作为参数来进行传递,而不必声明额外的(匿名)类。Flink 的所有算子都可以使用 Lambda 表达式的方式来进行编码。但是,当 Lambda 表达式使用 Java 的泛型时,我们需要 显式的声明类型信息

发现问题

利用lambda方法,将POJO类Event转换为二元数组

结果报以下错误

Exception in thread "main" org.apache.flink.api.common.functions.InvalidTypesException: The return type of function 'main(Transformation_returnType.java:23)' could not be determined automatically, due to type erasure. You can give type information hints by using the returns(...) method on the result of the transformation call, or by letting your function implement the 'ResultTypeQueryable' interface.

发生了泛型擦除。。。

分析问题

对于像 flatMap() 这样的函数,它的函数签名 void flatMap(IN value, Collector<OUT>
out) Java 编译器编译成了 void flatMap(IN value, Collector out) ,也就是说将 Collector 的泛 型信息擦除掉了。这样 Flink 就无法自动推断输出的类型信息了。
 
当使用 map() 函数返回 Flink 自定义的元组类型时也会发生类似的问题。下例中的函数签
Tuple2<String, Long> map(Event value) 被类型擦除为 Tuple2 map(Event value)
 
在这种情况下,我们需要显式地指定类型信息,否则输出将被视为 Object 类型,这会导
致低效的序列化。

解决问题

1、使用显式的 ".returns(...)"
 DataStream<Tuple2<String, Long>> stream3 = clicks
 .map( event -> Tuple2.of(event.user, 1L) )
 .returns(Types.TUPLE(Types.STRING, Types.LONG));  // 声明返回类型
 stream3.print();
2、使用类来替代 Lambda 表达式
 clicks.map(new MyTuple2Mapper()).print();

// 底下实现自定义的MyTuple2Mapper类
3、使用匿名类来代替 Lambda 表达式
 clicks.map(new MapFunction<Event, Tuple2<String, Long>>() {
     @Override
     public Tuple2<String, Long> map(Event value) throws Exception {
         return Tuple2.of(value.user, 1L);
     }
 }).print();

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值