Flink中Broadcast State(广播) 的理解和使用-nclk

一、Flink中广播Broadcast State

1、使用目的

是为了实现高效的关联字典数据(map side join),可以动态的修改Broadcast State里面的值!

2、使用方法
  • 创建两个了流,其中一个是可广播的流,另外一个是非广播的流
  • 可广播的流会通过网络广播到所有的TaskManager的TaskSlot中
  • 非广播的流要连接广播的流,然后就可以实现关联

在这里插入图片描述

二、需求

1、需要广播的字典数据
type,id,activity
INSERT,1,新人礼包
INSERT,2,女神节促销
INSERT,3,周末活动
UPDATE,3,周末抽奖
DELETE,3,周末抽奖
2、要关联字典的费广播数据
uid,dt,id
uid01,2020-03-08 11:11:11,2
uid01,2020-03-08 11:11:11,1
uid01,2020-03-08 11:11:11,3
uid01,2020-03-08 11:11:11,3

三、代码深入理解

1、将广播的流处理,广播到各个subTask中
import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.common.state.BroadcastState;
import org.apache.flink.api.common.state.MapStateDescriptor;
import org.apache.flink.api.common.state.ReadOnlyBroadcastState;
import org.apache.flink.api.java.tuple.Tuple3;
import org.apache.flink.api.java.tuple.Tuple4;
import org.apache.flink.streaming.api.datastream.BroadcastConnectedStream;
import org.apache
Flink,ValueState是一种状态类型,可以用于存储单个值。它通常用于对输入流的某些值进行聚合或累积计算,例如计算平均值或求和。以下是使用ValueState的示例代码: ``` // 导入必要的库 import org.apache.flink.api.common.functions.RichFlatMapFunction; import org.apache.flink.api.common.state.ValueState; import org.apache.flink.api.common.state.ValueStateDescriptor; import org.apache.flink.configuration.Configuration; import org.apache.flink.util.Collector; // 实现一个 RichFlatMapFunction public class MyFlatMapFunction extends RichFlatMapFunction<Integer, Integer> { private transient ValueState<Integer> sumState; @Override public void open(Configuration config) { // 初始化 ValueState ValueStateDescriptor<Integer> sumStateDescriptor = new ValueStateDescriptor<>("sum", Integer.class); sumState = getRuntimeContext().getState(sumStateDescriptor); } @Override public void flatMap(Integer value, Collector<Integer> out) throws Exception { // 从 ValueState 获取之前的累加结果 Integer sum = sumState.value(); if (sum == null) { sum = 0; } // 进行累加计算 sum += value; // 更新 ValueState 的值 sumState.update(sum); // 输出结果 out.collect(sum); } } ``` 在上面的示例,我们实现了一个 RichFlatMapFunction,使用ValueState对输入流的整数进行累加计算,并将结果输出。在open()方法,我们初始化了一个名为“sum”的ValueState。在flatMap()方法,我们首先从ValueState获取之前的累加结果,如果ValueState没有值,则将sum初始化为0。然后,我们进行累加计算,并更新ValueState的值。最后,我们将累加结果输出。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值