Flink实战之Kafka To Hive

最新推荐文章于 2024-04-28 22:55:46 发布

优优我心

最新推荐文章于 2024-04-28 22:55:46 发布

阅读量1.9k

点赞数

分类专栏： Flink实战系列 Flink Flink 1.11

本文链接：https://blog.csdn.net/weixin_41608066/article/details/110093474

版权

背景

传统的入库任务一般借助于MapReduce或者Spark来写hive表，一般都是天级别最多小时级别的任务。随着实时性要求越来越高，传统的入库不太能满足需求。Flink完全基于流式处理，同时也支持了写Hive表。本文介绍一下如果通过FlinkSQL实现kafka数据入库hive，并能够实时可查。

Hive Catalog

由于写hive表必须基于hive catalog，所以需要注册hive catalog。同时可以在一个job内切换catalog，如果我们不想把kafka的source table注册到hive metastore里面，那么就可以使用memory catalog。

SQL

完整SQL如下

USE CATALOG hive_catalog; 
USE mydb;--要写入的hive db
set table.sql-dialect=hive;
DROP TABLE IF EXISTS hive_table;
CREATE EXTERNAL TABLE hive_table (
    data_times

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

优优我心

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Flink实战之Kafka To Hive

背景传统的入库任务一般借助于MapReduce或者Spark来写hive表，一般都是天级别最多小时级别的任务。随着实时性要求越来越高，传统的入库不太能满足需求。Flink完全基于流式处理，同时也支持了写Hive表。本文介绍一下如果通过FlinkSQL实现kafka数据入库hive，并能够实时可查。Hive Catalog由于写hive表必须基于hive catalog，所以需要注册hive catalog。同时可以在一个job内切换catalog，如果我们不想把kafka的source table注册
复制链接

扫一扫