flink-18 flink之windows窗口

概念

把数据想象成一种流,窗口在流上滑动,显示指定时间段或指定个数的数据。
即windows是一种可以把无限无数据切割为有限数据块的手段

应用场景
对于流式处理,如果我们需要求取总和,平均值,或者最大值,最小值等,是做不到的,因为数据一直在源源不断的产生,即数据是没有边界的,所以没法求最大值,最小值,平均值等,所以为了一些数值统计的功能,我们必须指定时间段,对某一段时间的数据求取一些数据值是可以做到的。或者对某一些数据求取数据值也是可以做到的

窗口的类型

根据驱动划分,可以将窗口划分成两类

  • 时间驱动(Time Winodw)
    • 如:每5秒的数据
  • 事件驱动(Count Winow)
    • 如每100条数据

其他分类:

  • 滚动窗口(tumbling windows)
  • 滑动窗口(sliding windows)
  • 回话窗口(session windows)

如下
在这里插入图片描述

滚动窗口(tumbling windows)

滚动窗口之间没有重叠,且窗口长度是固定的
在这里插入图片描述

滑动窗口(sliding windows)

滑动窗口以一个步长(slide)不断向前滑动,窗口之间可能有重叠,窗口固定
在这里插入图片描述

会话窗口窗口(session windows)

会话窗口根据Session gap切分不同的窗口,当一个窗口在大于Session gap的时间内没有接收到新数据时,窗口将关闭(很少用)
在这里插入图片描述

窗口应用示例

TimeWindow的滚动多窗口和滑动窗口调用的方法一样

  • 如果传入一个参数就是调用滚动窗口
  • 如果传入两个参数就是调用滑动窗口

滑动窗口示例:

  • 每隔5s时间,统计最近10s出现的数据
import org.apache.flink.streaming.api.scala.{
   DataStream, StreamExecutionEnvironment}
import org.apache.flink.streaming.api.windowing.time.Time

object slide {
   
  def main(args: Array[String]): Unit = {
   
    val env: StreamExecutionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment
    import org.apache.flink.api.scala._
    val socDS: DataStream[String] = env.socketTextStream("node01",9999)
    socDS.flatMap(x=>x.split(" "))
      .map(x=>(x,1))
      .keyBy(0)
      // .timeWindow(Time.seconds(10))-->滚动窗口
      .timeWindow(Time.seconds(10),Time.seconds(
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值