Flink并行数据流

并行数据流

  • Flink应用程序的执行具有并行、分布式特性
  • Flink算子之间可以通过一对一模式或重新分布模式传输数据,具体采用哪种模式取决于算子的种类

一、 一对一模式

  • 一对一模式也被称为直传模式,该模式可以保留元素的分区和顺序信息
  • 同一分区的数据只会进入下游算子的相同分区
  • Map算子、Filter算子、FlatMap算子等都是一对一模式

二、 重新分发模式

  • 重新分发模式会更改数据所在的流分区
  • 如果在程序中使用了不同的算子,则每个算子子任务会根据不同的算子将数据发送给不同的目标子任务
  • 在重新分发数据的过程中,元素只有在每对输出和输入子任务之间才能保留其之间的顺序信息

三、 转换机器对应分发数据的模式

  • keyBy():通过散列键重新分区
  • Broadcast():广播
  • Rebalance():随机重新分发
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值