Flink 1.9 — SQL 创建 Kafka 数据源

前言

目前 Flink 1.9 SQL 支持用户直接使用 SQL 语句创建 Kafka 数据源,这极大的方便了用户开发 Flink 实时任务,你可以像 Hive 一样,使用 Create Table 语句来创建 Kafka Source,同时在也可以使用 Select 语句,从这个表中读取数据,进行窗口、ETL等操作。本文主要讲解 Flink 1.9 SQL 创建 Kafka 的 SQL 语法使用,当然,使用这个功能的前提,是你选择使用 Blink Planner。
在这里插入图片描述

引入 Blink Planner Maven 依赖

<dependency>
			<groupId>org.apache.flink</groupId>
			<artifactId>flink-table-planner-blink_2.11</artifactId>
			<version>1.9.0</version>
		</dependency>

Flink SQL Kafka Source DDL 语句

首先,一般你的 Kafka 数据源里面的消息格式为 Json ,这样在 Flink SQL 创建 Kafka 数据源的时候,指定消息格式为 Json,表中的定义的确保字段的名称和 Json 中的字段保持一致,下面是 Flink SQL 代码实例:

create table kafka_topic_src
(
id varchar,
name varchar,
age varchar,
) with (
'connector.type' = 'kafka', 
'connector.version' = '0.10',
'connector.topic' = 'your_topic',
'connector.properties.0.key' = 'group.id',
'connector.properties.0.value' = 'your_consumer_id',
'connector.properties.1.key' = 'bootstrap.servers',
'connector.properties.1.value' = 'your_bootstrap_servers',
'connector.property-version' = '1',
'connector.startup-mode' = 'latest-offset',
'format.type' = 'json',
'format.property-version' = '1',
'format.derive-schema' = 'true',
'update-mode' = 'append');

上面的 Flink SQL 语句中,定义了三个字段,id、name、age。所以你的 Json 数据格式要包含这三个字段,如果没有包含某个字段,Flink 默认会使用 null 进行填充。

当然,你也可以使用 Json 中部分字段进行使用,比如你只需要 Json 中的 id、name,你也可以这样定义:

create table kafka_topic_src
(
id varchar,
name varchar
) with (
'connector.type' = 'kafka', 
'connector.version' = '0.10',
'connector.topic' = 'your_topic',
'connector.properties.0.key' = 'group.id',
'connector.properties.0.value' = 'your_consumer_id',
'connector.properties.1.key' = 'bootstrap.servers',
'connector.properties.1.value' = 'your_bootstrap_servers',
'connector.property-version' = '1',
'connector.startup-mode' = 'latest-offset',
'format.type' = 'json',
'format.property-version' = '1',
'format.derive-schema' = 'true',
'update-mode' = 'append');

注意,如果你的 kafka 消息不是 Json的话,Flink 任务会一直报错,目前 Kafka 的 upadte-mode 只支持 append 模式。

在这里插入图片描述

Flink SQL Kafka Source DDL 属性值

connector.typeconnector的类型,kafka选择是kafka
connector.topickafka Topic
connector.startup-modeFlink kafka 消费者启动模式
format.typekafka 消息内容格式

Flink SQL Kafka Source DDL 注意点

Flink SQL 设置 kafka 消费者 group id
'connector.properties.0.key' = 'group.id',
'connector.properties.0.value' = 'track.log.teamtype.join' 

这两个参数一起来进行设置,在 with 后面的语句中。

设置 kafka bootstrap.servers
'connector.properties.1.key' = 'bootstrap.servers',
'connector.properties.1.value' = 'your_kafka_boots_servers'

这两个参数要一起设置,具体的 bootstrap.servers 就是你所使用 Topic 所在集群的链接信息。

欢迎关注我的微信公众号:「LakeShen」,在微信后台回复「Flink」,获取我个人独家整理的 Flink学习书籍、论文、以及好的博客。
在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值