Flink1.14.3 Table读写MySQL做数据聚合(1)

大数据研习社

已于 2022-04-28 18:52:59 修改

阅读量2.6k

点赞数 1

分类专栏：大数据实战精英+架构师 Flink 文章标签： mysql 数据库 java

于 2022-04-28 18:51:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dajiangtai007/article/details/124480839

版权

大数据实战精英+架构师同时被 2 个专栏收录

72 篇文章 57 订阅

订阅专栏

31 篇文章 9 订阅

订阅专栏

摘要

使用JDBC SQL Connector，Source只支持批处理，Sink支持批处理和流处理。
Sink支持数据追加和更新，如果Flink Table API做聚合操作，使用Sink必须指定指定主键。
本案例独家使用Flink Table API（非SQL）方式读写MySQL，官网只讲解了SQL的使用方式。

1 需求

需求：Flink Table API从MySQL读取数据，然后做聚合操作，最后将聚合结果写入MySQL。

2 添加Maven依赖

FlinkTable集成MySQL需引⼊如下依赖：

<dependency>

<groupId>org.apache.flink</groupId>

<artifactId>flink-connector-jdbc_2.11</artifactId>

<version>${flink.version}</version>

</dependency>

<dependency>

<groupId>mysql</groupId>

<artifactId>mysql-connector-java</artifactId>

<version>5.1.38</version>

</dependency>

3 准备MySQL数据源

在MySQL的test数据库中，创建clicklog表并导入初始数据集。

DROP TABLE IF EXISTS `clicklog`;

CREATE TABLE `clicklog` (

`user` varchar(20) NOT NULL,

`url` varchar(100) NOT NULL,

`cTime` varchar(30) NOT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

insert into `clicklog`(`user`,`url`,`cTime`) values ('Mary','./home','2022-02-02 12:00:00'),('Bob','./cart','2022-02-02 12:00:00'),('Mary','./prod?id=1','2022-02-02 12:00:05');

4 代码实现

Flink Table API读写MySQL的完整代码如下所示。

package com.bigdata.chap02;

import org.apache.flink.table.api.*;

import static org.apache.flink.table.api.Expressions.$;

public class FlinkTableAPIMySQL2MySQL {

public static void main(String[] args) {

//1、创建TableEnvironment

EnvironmentSettings settings = EnvironmentSettings

.newInstance()

.build();

TableEnvironment tEnv = TableEnvironment.create(settings);

//2、创建Mysql source table

Schema sourceschema = Schema.newBuilder()

//.primaryKey("user")

.column("user", DataTypes.STRING())

.column("url", DataTypes.STRING())

.column("cTime", DataTypes.STRING())

.build();

tEnv.createTemporaryTable("sourceTable", TableDescriptor.forConnector("jdbc")

.schema(sourceschema)

.option("url","jdbc:mysql://hadoop1:3306/test")

.option("driver","com.mysql.jdbc.Driver")

.option("table-name","clicklog")

.option("username","hive")

.option("password","hive")

.build());

tEnv.from("sourceTable").printSchema();

//3、创建MySQL sink table

Schema sinkschema = Schema.newBuilder()

//通过notNull()指定主键为非空

.column("username",DataTypes.STRING().notNull())

.column("count", DataTypes.BIGINT())

//指定主键

.primaryKey("username")

.build();

tEnv.createTemporaryTable("sinkTable", TableDescriptor.forConnector("jdbc")

.schema(sinkschema)

.option("url","jdbc:mysql://hadoop1:3306/test")

.option("driver","com.mysql.jdbc.Driver")

.option("table-name","clickcount")

.option("username","hive")

.option("password","hive")

.build());

//5、输出

Table reusltTable = tEnv.from("sourceTable")

.groupBy($("user"))

.aggregate($("url").count().as("count"))

.select($("user").as("username"), $("count"))

;

reusltTable.printSchema();

reusltTable.executeInsert("sinkTable");

}

}

备注：Flink Table API做聚合操作插入MySQL，必须指定主键（.primaryKey("username")），同时必须指定主键为非空（.column("username",DataTypes.STRING().notNull())）

5 MySQL业务建表

在MySQL的test数据库中，创建clickcount表用于Flink Table的聚合数据。

DROP TABLE IF EXISTS `clickcount`;

CREATE TABLE `clickcount` (

`username` varchar(20) NOT NULL DEFAULT '',

`count` int(11) DEFAULT NULL,

PRIMARY KEY (`username`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

注意：如果clickcount表需要做更新操作，需要指定主键（primary key），如username。

6 测试运行

打开MySQL连接工具，查询clickcount表中的数据，如果聚合数据能插入clickcount表，说明Flink Table API能成功将聚合数据写入MySQL数据库。

7 注意事项

注意：

使用JDBC SQL connector过程中，作为source只支持批处理，作为sink既可以用于批处理又可以用于流处理。
Sink支持数据的追加和更新，如果Flink Table API做聚合操作，使用sink更新聚合数据，必须指定指定主键。
本案例独家使用Flink Table API（非SQL）方式读写MySQL，官网只讲解了SQL的使用方式。

大数据研习社

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
Flink1.14.3 Table读写MySQL做数据聚合(1)

摘要使用JDBC SQL Connector，Source只支持批处理，Sink支持批处理和流处理。 Sink支持数据追加和更新，如果Flink Table API做聚合操作，使用Sink必须指定指定主键。本案例独家使用Flink Table API（非SQL）方式读写MySQL，官网只讲解了SQL的使用方式。1 需求需求：Flink Table API从MySQL读取数据，然后做聚合操作，最后将聚合结果写入MySQL。2 添加Maven依赖FlinkTable集成My.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大数据研习社 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。