flink整合java,Flink使用SideOutPut替换Split实现分流

最新推荐文章于 2022-07-03 09:49:39 发布

IAmAngry.

最新推荐文章于 2022-07-03 09:49:39 发布

阅读量396

点赞数

文章标签： flink整合java

基于apache flink的流处理实时模型

44元

包邮

(需用券)

去购买 >

以前的数据分析项目(版本1.4.2)，对从Kafka读取的原始数据流，调用split接口实现分流.

新项目决定使用Flink 1.7.2，使用split接口进行分流的时候，发现接口被标记为depracted(后续可能会被移除).

搜索相关文档，发现新版本Flink中推荐使用带外数据进行分流.

预先建立OutputTag实例(LogEntity是从kafka读取的日志实例类).

private static final OutputTag APP_LOG_TAG = new OutputTag<>("appLog", TypeInformation.of(LogEntity.class));

private static final OutputTag ANALYZE_METRIC_TAG = new OutputTag<>("analyzeMetricLog", TypeInformation.of(LogEntity.class));

对kafka读取的原始数据，通过process接口，打上相应标记.

private static SingleOutputStreamOperator sideOutStream(DataStream rawLogStream) {

return rawLogStream

.process(new ProcessFunction() {

@Override

public void processElement(LogEntity entity, Context ctx, Collector out) throws Exception {

// 根据日志等级，给对象打上不同的标记

if (entity.getLevel().equals(ANALYZE_LOG_LEVEL)) {

ctx.output(ANALYZE_METRIC_TAG, entity);

} else {

ctx.output(APP_LOG_TAG, entity);

}

}

})

.name("RawLogEntitySplitStream");

}

// 调用函数，对原始数据流中的对象进行标记

SingleOutputStreamOperator sideOutLogStream = sideOutStream(rawLogStream);

// 根据标记，获取不同的数据流，以便后续进行进一步分析

DataStream appLogStream = sideOutLogStream.getSideOutput(APP_LOG_TAG);

DataStream rawAnalyzeMetricLogStream = sideOutLogStream.getSideOutput(ANALYZE_METRIC_TAG);

通过以上步骤，就实现了数据流的切分.

PS:

如果您觉得我的文章对您有帮助，请关注我的微信公众号，谢谢!

原文链接:https://www.cnblogs.com/jason1990/p/11610130.html

java 11官方入门(第8版)教材

79.84元

包邮

(需用券)

去购买 >

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。