flink reduce使用详解

前言

对MapReduce开发流程比较熟悉的同学,对MapReduce的数据处理流程和原理应该比较清晰,顾名思义,Map阶段对数据进行打散,打散后进行数据的初步拆分,然后输出到Reduce阶段,而Reduce阶段是对数据进行规整、汇集,最终得到期望的输出结果

这个思想同样可运用于此处flink的reduce处理的理解,在flink 的API中,Reduce的解释如下:

一个分组数据流的聚合操作,合并当前的元素和上次聚合的结果,产生一个新的值,返回的流中包含每一次聚合的结果,而不是只返回最后一次聚合的最终结果

通俗来讲,就是对上一步得到的输出流进行进一步的归集,上一步的流是哪些呢?比如上一篇中我们谈到的通过聚合算子得到的KeyedStream , 经过分组后的KeyedStream 里面包含了分组的结果信息

那么reduce要做的事情就是,针对上一步经过分组后的KeyedStream的分组信息,做进一步的数据聚合,比如获取分组数据中的最小值、最大值等

下面来看一个具体的需求:

对文本中的数据进行聚合统计后分组处理,然后再输出每个分组中的最小问题

仍然以上一篇的输入文本数据为例,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

逆风飞翔的小叔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值