flink状态管理-keyed

最新推荐文章于 2022-12-25 17:02:28 发布

爱学习的小肥猪

最新推荐文章于 2022-12-25 17:02:28 发布

阅读量205

点赞数

分类专栏： flink

本文链接：https://blog.csdn.net/heima201907/article/details/102819558

版权

本文详细介绍了Flink的状态管理，重点讲解了Keyed State的概念和类型，包括ValueState、ListState、ReducingState、AggregatingState、FoldingState和MapState。此外，还提到了Managed State、Raw State的区别以及State Time-To-Live (TTL)的配置和超时状态的清除策略。

摘要由CSDN通过智能技术生成

Flink主要有两种基础类型的状态：keyed state 和operator state。

一、Keyed State

Keyed State总是和keys相关，并且只能用于KeyedStream上的函数和操作。
你可以将Keyed State视为是已经被分片或分区的Operator State，每个key都有且仅有一个状态分区(state-partition)。每个keyed-state逻辑上绑定到一个唯一的<parallel-operator-instance, key>组合上，由于每个key“属于”keyed operator的一个并行实例，所以我们可以简单的认为是<operator,key>。
Keyed State进一步被组织到所谓的Key Groups中。Key Groups是Flink能够重新分配keyed State的原子单元。Key Groups的数量等于定义的最大并行度。在一个keyed operator的并行实例执行期间，它与一个或多个Key Groups配合工作。

二、Raw and Managed State

Keyed State 和 Operator State 有两种形式: managed和raw。Managed State表示数据结构由Flink runtime控制，例如内部哈希表或者RocksDB。例如，“ValueState”，“ListState”等等。Flink的runtime层会编码State并将其写入checkpoint中。Raw State是操作算子保存在它的数据结构中的state。当进行checkpoint时，它只写入字节序列到checkpoint中。Flink并不知道状态的数据结构，并且只能看到raw字节。所有的数据流函数都可以使用managed state，但是raw state接口只可以在操作算子的实现类中使用。推荐使用managed state(而不是raw state)，因为使用managed state，当并行度变化时，Flink可以自动的重新分布状态，也可以做更好的内存管理。如果你的managed state需要自定义序列化逻辑，需要对managed state的自定义序列化以确保未来的兼容性。Flink默认的序列化不需要特殊处理。

三、Managed Keyed State

    managed keyed state接口提供了对当前输入元素的key的不同类型的状态的访问。这意味着这种类型的状态只能在KeyedStream中使用，它可以通过stream.keyBy(...)创建。
   现在，我们首先看下不同类型的状态，然后展示如何在程序中使用它们。可用的状态有：
   ValueState<T>:它会保存一个可以被更新和查询的值(受限于上面提到的输入元素的key，算子看到的每个key可能仅一个值)。可使用update(T) 和 T value() 更新和查询值。

ListState<T>: 它保存了一个元素列表。你可以添加元素和检索Iterable来获取所有当前存储的元素。添加元素使用add(T)或者addAll(List<T>)方法，获取Iterable使用Iterable<T> get()方法。也可以使用update(List<T>)覆盖已有的list。

ReducingState<T>: 它保存了一个聚合了所有添加到这个状态的值的结果。接口和ListState相同，但是使用add(T)方法本质是使用指定Reduc

最低0.47元/天解锁文章

爱学习的小肥猪

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
flink状态管理-keyed

Flink主要有两种基础类型的状态：keyed state 和operator state。一、Keyed State Keyed State总是和keys相关，并且只能用于KeyedStream上的函数和操作。你可以将Keyed State视为是已经被分片或分区的Operator State，每个key都有且仅有一个状态分区(state-partition)。每个keyed-...
复制链接

扫一扫

专栏目录