Flink读取kafka数据并以parquet格式写入HDFS

最新推荐文章于 2024-05-05 15:30:06 发布

王知无(import_bigdata)

最新推荐文章于 2024-05-05 15:30:06 发布

阅读量6.9k

点赞数 1

分类专栏： Flink系统性学习专栏

原创文章禁止转载。否则追究法律后果。

本文链接：https://blog.csdn.net/u013411339/article/details/88937671

版权

Flink系统性学习专栏同时被 2 个专栏收录

256 篇文章 101 订阅 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

大数据成神之路

254 篇文章 157 订阅

订阅专栏

大数据业务场景中，经常有一种场景：外部数据发送到kafka中，flink作为中间件消费kafka数据并进行业务处理；处理完成之后的数据可能还需要写入到数据库或者文件系统中，比如写入hdfs中；
目前基于spark进行计算比较主流，需要读取hdfs上的数据，可以通过读取parquet：spark.read.parquet(path)

数据实体：

public class Prti {
 
    private String passingTime;
 
    private String plateNo;
 
    public Prti() {
    }
 
   //gettter and setter 方法....
}

public class FlinkReadKafkaToHdfs {
 
    private final static StreamExecutionEnvironment environment = S

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

王知无(import_bigdata)

关注关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
Flink读取kafka数据并以parquet格式写入HDFS

大数据业务场景中，经常有一种场景：外部数据发送到kafka中，flink作为中间件消费kafka数据并进行业务处理；处理完成之后的数据可能还需要写入到数据库或者文件系统中，比如写入hdfs中；目前基于spark进行计算比较主流，需要读取hdfs上的数据，可以通过读取parquet：spark.read.parquet(path)数据实体：public class Prti { ...
复制链接

扫一扫