Flink Table Api示例：从kafka读取数据转换成Hudi数据并打印

cts618

已于 2022-12-01 14:55:49 修改

阅读量693

点赞数

分类专栏： Hudi Flink Table Api 文章标签： kafka flink java

于 2022-12-01 14:54:34 首次发布

cts618

本文链接：https://blog.csdn.net/w13716207404/article/details/128132147

版权

Hudi 同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

Flink Table Api

2 篇文章 0 订阅

订阅专栏

package cn.itcast.hudi;

import org.apache.flink.table.api.EnvironmentSettings;
import org.apache.flink.table.api.Table;
import org.apache.flink.table.api.TableEnvironment;

import static org.apache.flink.table.api.Expressions.*;

/***
 * Flink Table Api示例：
 * 需求说明：从kafka读取数据转换成Hudi数据并打印
 */

public class FlinkSQLKafkaDemo {
    public static void main(String[] args) {
        // 1-获取表执行环境
        EnvironmentSettings settings = EnvironmentSettings
                .newInstance()
                .inStreamingMode() // 设置流式模式
                .build();
        TableEnvironment tableEnv = TableEnvironment.create(settings);

        // 2-创建输入表，TODO：从Kafka消费数据
        tableEnv.executeSql(
                "CREATE TABLE order_kafka_source ( " +
                        "  orderId STRING, " +
                        "  userId STRING, " +
                        "  orderTime STRING, " +
                        "  ip STRING, " +
                        "  orderMoney DOUBLE, " +
                        "  orderStatus INT " +
                        ") WITH ( " +
                        "  'connector' = 'kafka', " +
                        "  'topic' = 'order-topic', " +
                        "  'properties.bootstrap.servers' = 'node1.itcast.cn:9092', " +
                        "  'properties.group.id' = 'gid-1001', " +
                        "  'scan.startup.mode' = 'latest-offset', " +
                        "  'format' = 'json', " +
                        "  'json.fail-on-missing-field' = 'false', " +
                        "  'json.ignore-parse-errors' = 'true' " +
                        ")"
        );

        // 3-转换数据：可以使用SQL，也可以时Table API
        Table etlTable = tableEnv
                .from("order_kafka_source")
                // 添加字段：Hudi表分区字段， "orderTime": "2021-11-22 10:34:34.136" -> 021-11-22
                .addColumns(
                        $("orderTime").substring(0, 10).as("partition_day")
                )
                // 添加字段：Hudi表数据合并字段，时间戳, "orderId": "20211122103434136000001" ->  20211122103434136
                .addColumns(
                        $("orderId").substring(0, 17).as("ts")
                );
        tableEnv.createTemporaryView("view_order", etlTable);

        // 4-创建输入表，TODO: 将结果数据进行输出
        tableEnv.executeSql("SELECT * FROM view_order").print();


    }
}