Flink SQL 同步 Kafka 数据到 HDFS(parquet + snappy)
在上一篇文章中,我们用 datastream API 实现了从 Kafka 读取数据写到 HDFS 并且用 snappy 压缩,今天这篇文章我们来实现一个 Flink SQL 版本的,为了方便我直接采用 sql-client 提交任务的方式来演示。
添加 jar 包
第一步肯定是添加我们需要的 jar 包了,一共需要下面这几个 jar 包:
flink-connector-files-1.15.1.jar
flink-sql-connector-kafka-1.15.1.jar
flink-sql-parquet-1.15.1.jar
hadoop-mapreduce-client-core-2.9.0.jar