Flink1.12 - 通过TableAPI实现时间窗口和水位线

package com.hyr.flink.tableApiAndSQL.streaming

import com.hyr.flink.common.StationLog
import com.hyr.flink.common.watermarkgenerator.BoundedOutOfOrdernessGenerator
import com.hyr.flink.datastream.source.MyCustomSource
import org.apache.flink.api.common.eventtime.{WatermarkGenerator, WatermarkGeneratorSupplier, WatermarkStrategy}
import org.apache.flink.streaming.api.scala.{DataStream, StreamExecutionEnvironment, _}
import org.apache.flink.table.api.EnvironmentSettings
import org.apache.flink.table.api.bridge.scala.StreamTableEnvironment
import org.apache.flink.types.Row

/** *****************************************************************************
 *
 * @date 2021-05-13 9:57 下午
 * @author: <a href=mailto:huangyr@com>huangyr</a>
 * @Description: TableAPI的时间窗口和水位线
 ******************************************************************************/
object WindowWithTableAPI {

  def main(args: Array[String]): Unit = {
    val streamEnv: StreamExecutionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment
    // 通过flink的原生的方式创建setting 实时
    val settings: EnvironmentSettings = EnvironmentSettings.newInstance().useOldPlanner().inStreamingMode().build()
    // 多并行度会自动对齐WaterMark,取最小的WaterMark。避免干扰,将并行度设为1
    streamEnv.setParallelism(1)
    // 周期性的引入WaterMark 间隔100毫秒
    streamEnv.getConfig.setAutoWatermarkInterval(1000)
    // streamEnv.setStreamTimeCharacteristic(TimeCharacteristic.EventTime) // default,可以不调用

    // 创建table环境
    val tableEnv: StreamTableEnvironment = StreamTableEnvironment.create(streamEnv, settings)

    //读取数据源
    val stream: DataStream[StationLog] = streamEnv.addSource(new MyCustomSource)
      .assignAscendingTimestamps(_.callTime)
      // 水位线
      .assignTimestampsAndWatermarks(new WatermarkStrategy[StationLog] {
        override def createWatermarkGenerator(context: WatermarkGeneratorSupplier.Context): WatermarkGenerator[StationLog] = {
          // 最长延迟10秒
          new BoundedOutOfOrdernessGenerator(10 * 1000L)
        }
      })

    import org.apache.flink.table.api._
    // 处理时间属性可以在 schema 定义的时候用 .proctime 后缀来定义。
    // 事件时间属性可以用 .rowtime 后缀在定义 DataStream schema 的时候来定义。
    val table: Table = tableEnv.fromDataStream(stream, $"sid", $"callOut", $"callIn", $"callType", $"callTime".rowtime(), $"duration")
    table.printSchema()

    // 开窗口
    // val windowedTable = table.window(Slide over 10.second every 5.second on $"callTime" as "callTimeWindow") // 滑动窗口

    // val windowedTable = table.window(Tumble.over(5.second).on($"callTime").as("callTimeWindow")) // 滚动窗口
    val windowedTable = table.window(Tumble over 5.second on $"callTime" as "callTimeWindow") // 滚动窗口
    val tableResult: Table = windowedTable.groupBy($"callTimeWindow", $"sid")
      .select($"sid", $"callTimeWindow".start, $"callTimeWindow".end, $"sid".count)

    val result: DataStream[(Boolean, Row)] = tableEnv.toRetractStream(tableResult)
    result.filter(_._1 == true)
      .print()

    streamEnv.execute(this.getClass.getName)
  }

}

Github地址:
https://github.com/huangyueranbbc/FlinkDemo

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值