flink左内连接Java_flink dataset join笔记

最新推荐文章于 2022-05-18 17:39:31 发布

陈良乔

最新推荐文章于 2022-05-18 17:39:31 发布

阅读量625

点赞数

文章标签： flink左内连接Java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30391889/article/details/114753509

版权

1、dataset的join连接，通过key进行关联，一般情况下的join都是inner join，类似sql里的inner join

key包括以下几种情况：

a key expression

a key-selector function

one or more field position keys (Tuple DataSet only).

Case Class Fields

2、inner join的几种情况

2.1 缺省的join，jion到一个Tuple2元组里

public static class User { public String name; public intzip; }public static class Store { public Manager mgr; public intzip; }

DataSet input1 = //[...]

DataSet input2 = //[...]//result dataset is typed as Tuple2

DataSet>result=input1.join(input2)

.where("zip") //key of the first input (users)

.equalTo("zip"); //key of the second input (stores)

2.2 用户自定义JoinFuncation，使用with语句

//some POJO

public classRating {publicString name;publicString category;public intpoints;

}//Join function that joins a custom POJO with a Tuple

public classPointWeighterimplements JoinFunction, Tuple2>{

@Overridepublic Tuple2 join(Rating rating, Tuple2weight) {//multiply the points and rating and construct a new output tuple

return new Tuple2(rating.name, rating.points *weight.f1);

}

}

DataSet ratings = //[...]

DataSet> weights = //[...]

DataSet>weightedRatings=ratings.join(weights)//key of the first input

.where("category")//key of the second input

.equalTo("f0")//applying the JoinFunction on joining pairs

.with(new PointWeighter());

2.3 使用Flat-Join Function，这种JoinFuncation和FlatJoinFuncation与MapFuncation和FlatMapFuncation的关系类似

public classPointWeighterimplements FlatJoinFunction, Tuple2>{

@Overridepublic void join(Rating rating, Tuple2weight,

Collector>out) {if (weight.f1 > 0.1) {

out.collect(new Tuple2(rating.name, rating.poi

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
flink左内连接Java_flink dataset join笔记

1、dataset的join连接，通过key进行关联，一般情况下的join都是inner join，类似sql里的inner joinkey包括以下几种情况：a key expressiona key-selector functionone or more field position keys (Tuple DataSet only).Case Class Fields2、inner join...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。