Flink——状态管理
1 有状态计算
有状态计算是Flink非常重要的特性之一。什么是状态?一般来说,状态是由一个task维护,并用于计算某个结果的所有数据,都属于这个任务的状态。也可以理解为一个本地变量,可以被task的业务逻辑访问。下图展示了一个task与它的state的常规交互过程:task在处理数据时,会先访问state,并根据输入信息和state信息更新state。

Flink会处理所有关于state一致性、故障处理、高效存储并访问等问题,开发者仅需关注在他们的应用逻辑即可。在Flink中,状态始终与特定算子相关联。为了让Flink的runtime可以意识到一个operator的state,operator需要注册它的state。
Flink中包含两种基础的状态:
- Keyed State:键控状态,表示和key相关的一种state,基于KeyedStream上的状态。键控状态数据结构:
- value state:将state表示为单个值
- list state:以list表示state
- map state:以map,key-value对表示state
- Operator State:算子状态,作用范围限定为算子任务,一个任务一个状态。同一任务共享state。算子状态数据结构:
- list state&

最低0.47元/天 解锁文章
1682

被折叠的 条评论
为什么被折叠?



