Flink State示例

Flink State示例

// 流1 要先按照id分组,再设置水印和事件时间,因为后面注册的定时器是基于事件时间的
DataStreamSource<Order> sourceStream1 = env.addSource(consumer);
KeyedStream<Order, String> stream1 = sourceStream1.assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtractor<Order>(Time.seconds(5)) {
            @Override
            public long extractTimestamp(Order element) {
				// 这里从element中获取事件时间
                return Order.getTime;
            }
        }).keyBy(Order::getOrderId);
// 流2 要先按照id分组,再设置水印和事件时间,因为后面注册的定时器是基于事件时间的
DataStreamSource<Order> sourceStream2 = env.addSource(consumer);
KeyedStream<Order, String> stream2 = sourceStream1.assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtractor<Order>(Time.seconds(5)) {
            @Override
            public long extractTimestamp(Order element) {
				// 这里从element中获取事件时间
                return Order.getTime;
            }
        }).keyBy(Order::getOrderId);
// 定义两个侧切流的outputTag
OutputTag<Order> outputTag1 = new OutputTag<>("stream1");
OutputTag<Order> outputTag2 = new OutputTag<>("stream2");

做双流connect
 
stream1.connect(stream2).process(new CoProcessFunction<Order, Order, Tuple2<Order, Order>>() {
 
	// 流1的状态
	ValueState<Order> state1;
	// 流2的状态
	ValueState<Order> state2;
	
	// 定义一个用于删除定时器的状态
	ValueState<Long> timeState;
	
	@Override
	public void open(Configuration parameters) throws Exception {
		super.open(parameters);
		// 初始化状态
		state1 = getRuntimeContext().getState(new ValueStateDescriptor<>("state1", Order.class));
		state2 = getRuntimeContext().getState(new ValueStateDescriptor<>("state2", Order.class));
		timeState = getRuntimeContext().getState(new ValueStateDescriptor<>("timeState", Long.class));
	}
	
	// 流1的处理逻辑
	@Override
	public void processElement1(Order value, Context ctx, Collector<Tuple2<Order, Order>> out) throws Exception {
		Order  value2 = state2.value();
		// 流2不为空表示流2先来了,直接将两个流拼接发到下游
		if (value2 != null) {
			out.collect(Tuple2.of(value, value2));
			// 清空流2对用的state信息
			state2.clear();
			// 流2来了就可以删除定时器了,并把定时器的状态清除
			ctx.timerService().deleteEventTimeTimer(timeState.value());
			timeState.clear();
		} else {
			// 流2还没来,将流1放入state1中,
			state1.update(value);
			// 并注册一个1分钟的定时器,流1中的 eventTime + 60s
			long time = value.getTime() + 60000;
			timeState.update(time);
			ctx.timerService().registerEventTimeTimer(time);
		}
	}
	
	// 流2的处理逻辑与流1的处理逻辑类似
	@Override
	public void processElement2(Order value, Context ctx, Collector<Tuple2<Order, Order>> out) throws Exception {
		Order value1 = state1.value();
		if (value1 != null) {
			out.collect(Tuple2.of(value1, value));
			state1.clear();
			ctx.timerService().deleteEventTimeTimer(timeState.value());
			timeState.clear();
		} else {
			state2.update(value);
			long time = value.getTime()+ 60000;
			timeState.update(time);
			ctx.timerService().registerEventTimeTimer(time);
		}
	}
	
	@Override
	public void onTimer(long timestamp, OnTimerContext ctx, Collector<Tuple2<Order, Order>> out) throws Exception {
		super.onTimer(timestamp, ctx, out);
		// 定时器触发了,即1分钟内没有收到两个流
		// 流1不为空,则将流1侧切输出
		if (state1.value() != null) {
		ctx.output(outputTag1, state1.value());
		}
	
		// 流2不为空,则将流2侧切输出
		if (state2.value() != null) {
		ctx.output(outputTag2, state2.value());
		}
	
		state1.clear();
		state2.clear();
	}
});
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
FlinkValueStateFlink状态编程中的一种状态类型。它用于在算子的处理函数中保存和访问一个单一的值。ValueState可以在算子的不同处理函数中共享和访问,以便跨时间和事件保持状态。 使用ValueState,可以在算子的处理函数中存储和更新一个值。这个值可以是任何类型,比如基本数据类型、自定义对象等。通过ValueState,算子可以在处理事件流时维护一些状态信息,从而实现一些有状态的计算逻辑。 要使用ValueState,首先需要在算子的运行时上下文中获取一个ValueStateDescriptor对象,该对象指定了ValueState的名称和类型。然后,可以通过调用ValueStateDescriptor的getState方法来获取具体的ValueState对象。通过这个ValueState对象,可以访问和更新存储在其中的值。 以下是一个示例代码片段,演示了如何在Flink中使用ValueState: ```java // 导入所需的类 import org.apache.flink.api.common.functions.RichFlatMapFunction; import org.apache.flink.api.common.state.ValueState; import org.apache.flink.api.common.state.ValueStateDescriptor; import org.apache.flink.util.Collector; public class MyFlatMapFunction extends RichFlatMapFunction<Integer, String> { // 声明一个ValueState变量 private transient ValueState<Integer> countState; @Override public void open(Configuration parameters) throws Exception { // 初始化ValueState ValueStateDescriptor<Integer> descriptor = new ValueStateDescriptor<>("countState", Integer.class); countState = getRuntimeContext().getState(descriptor); } @Override public void flatMap(Integer value, Collector<String> out) throws Exception { // 获取当前状态值 Integer currentCount = countState.value(); if (currentCount == null) { currentCount = 0; } // 更新状态值 currentCount += value; countState.update(currentCount); // 输出结果 out.collect("Current count: " + currentCount); } } ``` 在上述代码中,我们通过调用`getRuntimeContext().getState(descriptor)`获取了一个`ValueState<Integer>`对象,该对象用于存储和访问一个整数值。在`flatMap`函数中,我们首先通过`countState.value()`获取当前状态值,然后根据业务逻辑更新状态值,并通过`countState.update(currentCount)`方法更新状态。最后,我们使用`out.collect`方法将结果输出。 这只是一个简单的示例,实际中可以根据业务需求使用ValueState来实现更复杂的状态计算逻辑。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值