从0到1Flink的成长之路(二十)-Flink 高级特性(二)之状态分类

状态分类

working-with-state
1 组织形式划分
转态State存在的两种形式(Forms):Managed(管理)和Raw(原始)。
在这里插入图片描述
从Flink是否接管角度,状态可以分为:
ManagedState(托管状态)
RawState(原始状态)

两者的区别如下:

  1. 从状态管理方式的方式,Managed State 由 Flink Runtime 管理,自动存储,自动恢复,在内存管理上有优化;而 Raw State 需要用户自己管理,需要自己序列化,Flink不知道 State中存入的数据是什么结构,只有用户自己知道,需要最终序列化为可存储的数据结构。
  2. 从状态数据结构来说,Managed State 支持已知的数据结构,如 Value、List、Map 等。而Raw State只支持字节数组 ,所有状态都要转换为二进制字节数组才可以。
  3. 从推荐使用场景来说,Managed State 大多数情况下均可使用,而 Raw State 是当
    Managed State 不够用时,比如需要自定义 Operator 时,才会使用 Raw State。
    在实际生产中,都只推荐使用ManagedState,后续将围绕该话题进行讨论。

2 基本类型划分
Flink中有两种基本的状态:Keyed State 和 Operator State。
在这里插入图片描述
Managed State 分为两种:Keyed State 和 Operator State ,Raw State都是Operator State。
Keyed State
在Flink Stream模型中,Datastream 经过 keyBy 的操作可以变为 KeyedStream。
Keyed State是基于KeyedStream上的状态,这个状态是跟特定的key绑定的,对KeyedStream流上的每一个key,都对应一个state,如stream.keyBy(…)。 keyBy之后的State,可以理解为分区过的State,每个并行keyed Operator的每个实例的每个key都有一个Keyed State,即<parallel-operator-instance,key>就是一个唯一的状态,由于每个key属于一个keyed Operator的并行实例,可以将其简单的理解为<operator,key>。
在这里插入图片描述
Operator State
在这里插入图片描述
这里的fromElements会调用FromElementsFunction的类,其中就使用了类型为 list state 的operator state。
Operator State又称为 non-keyed state,与Key无关的State,每一个 operator state 都仅与一个 operator 的实例绑定。Operator State 可以用于所有算子,但一般常用于Source。
在这里插入图片描述

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值