[原创] Flink Catalog 小结

白羊鱼-

已于 2024-04-24 13:09:05 修改

阅读量387

点赞数 5

分类专栏：大数据文章标签： flink 大数据

于 2024-04-24 13:04:06 首次发布

本文链接：https://blog.csdn.net/hy340881/article/details/138155820

版权

1 篇文章 0 订阅

订阅专栏

类似于 Hive 的 MetaStore，用来管理 Flink SQL 表的元数据信息。

内存：Flink 任务重启后，就失效了，需要重建。
放在 Hive 中：通过使用 Flink 的 Hive Catalog，可以将 Flink 的元数据信息存放到 Hive 的 MetaStore 中进行持久化保存。这样Flink 任务重启后，依旧可以找到重启前的 Flink 表的元数据信息，而无需重建。

持久化 Flink 表的元数据信息。
Flink 可以通过访问 Hive MetaStore，访问操作属于 Hive 的表，也可以使用 Flink SQL 直接在 Hive 上创建属于 Hive 的表。

上面两处“属于 Hive 的表”的说明：前者侧重指，原本在 Hive 上就已经存在的 Hive 表；后者侧重指，后续插入数据时，数据是存放在 Hive 上，当然该表也可以被 Hive 本身访问操作。

It's recommended to use Hive dialect to execute DDLs to create Hive tables, views, partitions, functions within Flink.

创建属于 Hive 的表之前，将当前 Flink SQL 环境切换到 Hive 方言：

SET table.sql-dialect = hive; -- to use Hive dialect
SET table.sql-dialect = default; -- to use Flink default dialect

最后，判定 Flink SQL 创建的表是否属于 Flink 还是属于 Hive 等外部数据库的终极标识：dec 创建的表

关注