Flink实战(三)

Flink核心概念和编程模型

Flink分层架构

Flink核心组件

  1. 核心组件
    Flink核心组件

Flink分层架构

Flink分层架构

  1. Stateful Stream Processing
  • 位于最底层,是core API的底层实现
  • Processing Function
  • 利用低阶,构建一些新的组件或者算子
  • 灵活性高,但是开发复杂
  1. Core APIS
  • DataSet API(批处理)
  • DataStream API(流处理)
  1. Table API & SQL
  • SQL构建在Table之上,需要构建Table环境(不同类型的Table需要不同类型的Table环境)
  • Table可以和DataStream或者DataSet互相转化
  • Stream SQL最终会转化成流式的执行计划

Flink DataFlow

Flink DataFlow基本套路

  1. Flink DataFlow编程基本套路
    Flink DataFlow基本套路

代码

  1. 并行化DataFlow
    并行化DataFlow
  2. 算子间数据传递模式
  • One-to-One Streams(保持元素的分区和顺序)
  • Redistrbuting Streams(改变流的分区)
    (keyby() broadcas() rebanlance())

其他概念

Time

各种time

Window

各种window

statuful Operations

statuful Operations

Checkpoints

Checkpoints

  1. 基于chandy-lamport分布式一致性快照算法基础上实现的(https://zhuanlan.zhihu.com/p/53482103)

Savepoint

Savepoint

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值