FlinkSQL源码解析(三)执行流程

本文详细介绍了Flink SQL的执行流程,从sqlNode到RelNode的转化,重点讨论如何调用连接器。通过示例代码展示了建表和插入操作,强调了错误的连接器定义会在插入语句时才报错。同时,解释了处理时间和事件时间的概念,并使用HOP函数进行窗口聚合。
摘要由CSDN通过智能技术生成

1、前言

        前面2部分主要是介绍以下2点:

  1. flink sql整体的执行流程大致为:sqlNode --> Operation --> RelNode --> 优化 --> execNode --> Transformation。
  2. 以及flink sql源码解析需要使用到的java spi。

         现在具体来看看flink sql 在其内部转换的实现步骤,就是如何去调用连接器,主要是在sqlNode --> RelNode这一步。

        当执行建表语句,主要是进行语法的校验。真正把输入源、输出源连接在一起执行的,还是通过insert语句。即当我们在定义输入表或者输出表,有错误的定义connecter='abc',也不会在执行建表语句时返回错误,而是在执行插入语句时报错。这里以一份简单的代码为例:

 def main(args: Array[String]): Unit = {
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    env.setParallelism(10)
    env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)

    val settings = EnvironmentSettings.newInstance()
      .useBlinkPlanner()
      .inStreamingMode()
      .build()

    val tableEnv = StreamTableEnvironment.create(env, settings)
    tableEnv.getConfig.setLocalTimeZone(ofHours(8))
    tableEnv.getConfig().getConfiguration().setBoolean("table.exec.emit.early-fire.enabled", true)
    tableEnv.getConfig().getConfiguration().setString("table.exec.emit.early-fire.delay", "5000ms")

    tableEnv.executeSql(
      """
        |CREATE TABLE input (
        |    userId STRING,
        |    pageId STRING,
        |    sign STRING,
        |    proctime AS PROCTIME(),   -- generates processing-time attribute using computed column
        |    eventTime TIMESTAMP(3),
        |    WATERMARK FOR eventTime AS eventTime - INTERVAL '5' SECOND  -- defines watermark on ts column, marks ts as event-time attribute
        |) WITH (
        |    'connector' = 'kafka',  -- using kafka connector
        |    'topic' = 'flinksource',  -- kafka topic
        |    'scan.startup.mode' = 'latest-offset',  -- reading from the latest
        |    'properties.bootstrap.servers' = 'hadoop1:9092,hadoop2:9092,hadoop3:9092',  -- kafka broker address
        |    'format' = 'json'  -- the data format is json
        |)
        |
      """.stripMargin)

    tableEnv.executeSql(
      """
        |CREATE TABLE output (
        |    userId STRING,
        |    pageId STRING,
        |    cnt BIGINT,
        |    startTime timestamp,
        |    endTime timestamp
        |) WITH (
        |    'connector' = 'print'
        |)
        |
      """.stripMargin)

    tableEnv.executeSql(
      """
        | insert into output
        | select
        | userId,
        | pageId,
        | count(*) as cnt,
        | HOP_START(eventTime, interval '1' HOUR, interval '1' DAY) as startTime,
        | HOP_END(eventTime, interval '1' HOUR, interval '1' DAY) as endTime
        |from (
        | select * from input where sign = 'error'
        |) a group by userId,pageId, hop(eventTime, interval '1' HOUR, interval '1' DAY)
      """.stripMargin)
    env.execute("insertDemo")
  }

2.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值