【Flink SQL】Flink SQL 基础概念，我们用最详细的方式解析大数据开发消息机制的源码

最新推荐文章于 2024-04-16 16:52:38 发布

2401_84181108

最新推荐文章于 2024-04-16 16:52:38 发布

阅读量1k

点赞数 25

分类专栏： 2024年程序员学习文章标签：大数据 flink sql

本文链接：https://blog.csdn.net/2401_84181108/article/details/137497645

版权

本文详细介绍了Flink SQL如何创建外部数据表和视图，包括Table API和SQL API的用法。通过实例展示了如何使用Table API和SQL API从Kafka创建数据源表，以及如何创建临时和永久视图。同时，强调了临时表和永久表的差异，并提供了SQL查询案例。最后探讨了Flink SQL与DataStream API之间的转换，以及在不同版本中的限制和未来支持。

摘要由CSDN通过智能技术生成

) WITH (
‘connector’ = ‘user_defined’,
‘format’ = ‘json’,
‘class.name’ = ‘flink.examples.sql._03.source_sink.table.user_defined.UserDefinedSource’
);

– 临时视图
CREATE TEMPORARY VIEW query_view as
SELECT *
FROM source_table;

永久表：需要外部 Catalog（例如 Hive Metastore）来持久化表的元数据。一旦永久表被创建，它将对任何连接到这个 Catalog 的 Flink Session 可见且持续存在，直至从 Catalog 中被明确删除。如下案例：

– 永久外部表。需要外部 Catalog 持久化！！！
CREATE TABLE source_table (
user_id BIGINT,
name STRING
) WITH (
‘connector’ = ‘user_defined’,
‘format’ = ‘json’,
‘class.name’ = ‘flink.examples.sql._03.source_sink.table.user_defined.UserDefinedSource’
);

– 永久视图。需要外部 Catalog 持久化！！！
CREATE VIEW query_view as
SELECT *
FROM source_table;

🚀 注意：如果临时表和永久表使用了相同的名称（Catalog名.数据库名.表名）。那么在这个 Flink Session 中，你的任务访问到这个表时，访问到的永远是临时表（即 相同名称的表，临时表会屏蔽永久表）。

2.5 SQL 外部数据表

由于目前在实时数据的场景中多以消息队列作为数据表。此处就以 Kafka 为例创建一个外部数据表。

2.5.1 Table API 创建外部数据表

public static void main(String[] args) throws Exception {

StreamExecutionEnvironment env =
StreamExecutionEnvironment.createLocalEnvironmentWithWebUI(new Configuration());

EnvironmentSettings settings = EnvironmentSettings
.newInstance()
.useBlinkPlanner()
.inStreamingMode()
.build();

StreamTableEnvironment tEnv = StreamTableEnvironment.create(env, settings);

// kafka 数据源
DataStream r = env.addSource(new FlinkKafkaConsumer(xxx));
// 将 DataStream 转为一个 Table API 中的 Table 对象进行使用
Table sourceTable = tEnv.fromDataStream(r
, Schema
.newBuilder()
.column(“f0”, “string”)
.column(“f1”, “string”)
.column(“f2”, “bigint”)
.columnByExpression(“proctime”, “PROCTIME()”)
.build());

tEnv.createTemporaryView(“source_table”, sourceTable);

String selectWhereSql = “select f0 from source_table where f1 = ‘b’”;

Table resultTable = tEnv.sqlQuery(selectWhereSql);

tEnv.toRetractStream(resultTable, Row.class).print();

env.execute();
}

上述案例中，Table API 将一个 DataStream 的结果集通过 StreamTableEnvironment::fromDataStream 转为一个 Table 对象来使用。

2.5.2 SQL API 创建外部数据表

EnvironmentSettings settings = EnvironmentSettings
.newInstance()
.useBlinkPlanner()
.inStreamingMo

最低0.47元/天解锁文章

2401_84181108

关注

25
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
【Flink SQL】Flink SQL 基础概念，我们用最详细的方式解析大数据开发消息机制的源码

外链图片转存中…(img-Q6f8UobA-1712542528936)][外链图片转存中…(img-dLCNW6rD-1712542528936)][外链图片转存中…(img-LqjeB1hR-1712542528936)][外链图片转存中…(img-z19UaOkh-1712542528936)]
复制链接

扫一扫