扫一扫加入大数据公众号和技术交流群,了解更多大数据技术,还有免费资料等你哦
BroadcastState简介
Broadcast State 是 Flink 1.5 引入的新特性。在开发过程中,如果遇到需要下发/广播配置、规则等低吞吐事件流到下游所有 task 时,就可以使用 Broadcast State 特性。下游的 task 接收这些配置、规则并保存为 BroadcastState, 将这些配置应用到另一个数据流的计算中 。Broadcast State 区别于其他 operator state 的地方有:
- Broadcast State 类似 Map 结构,可以 put get putAll remove 等
- 必须有一条广播流和一条非广播流
- 符合条件的 operator 可以有多个不同名字的 BroadcastState(疑惑:普通的 operator 也可以有多个不同名字的 state 吧,只是不是 BroadcastState。这么想
本文介绍了Flink的BroadcastState特性,用于广播低吞吐事件流到所有task。BroadcastState类似Map,适用于动态规则和实时流与维度Join场景。注意事项包括operator间无法通信、顺序可能不同步、内存存储限制及API使用。示例展示了如何在wordcount中应用BroadcastState以实现实时修改规则。

订阅专栏 解锁全文
247

被折叠的 条评论
为什么被折叠?



