flink 写入到es_10年大数据专家，使用Flink实现索引数据到Elasticsearch，快来学

最新推荐文章于 2024-05-15 14:57:38 发布

ReinhardHoneckerHans

最新推荐文章于 2024-05-15 14:57:38 发布

阅读量1.5k

点赞数

文章标签： flink 写入到es

本文链接：https://blog.csdn.net/weixin_33654339/article/details/112419489

版权

前言

使用Flink处理数据时，可以基于Flink提供的批式处理(Batch Processing)和流式处理(Streaming Processing)API来实现，分别能够满足不同场景下应用数据的处理。这两种模式下，输入处理都被抽象为Source Operator，包含对应输入数据的处理逻辑；输出处理都被抽象为Sink Operator，包含了对应输出数据的处理逻辑。这里，我们只关注输出的Sink Operator实现。

Flink批式处理模式，运行Flink Batch Job时作用在有界的输入数据集上，所以Job运行的时间是有时限的，一旦Job运行完成，对应的整个数据处理应用就已经结束，比如，输入是一个数据文件，或者一个Hive SQL查询对应的结果集，等等。在批式处理模式下处理数据的输出时，主要需要实现一个自定义的OutputFormat，然后基于该OutputFormat来构建一个Sink，下面看下OutputFormat接口的定义，如下所示：

上面，configure()方法用来配置一个OutputFormat的一些输出参数；open()方法用来实现与外部存储系统建立连接；writeRecord()方法用来实现对Flink Batch Job处理后，将数据记录输出到外部存储系统。开发Batch Job时，通过调用DataSet的output()方法，参数值使用一个OutputFormat的具体实现即可。后面，我们会基于Elasticsearch来实现上面接口中的各个方法。

Flink流式处理模式，运行Flink Streaming Job时一般输入的数据集为流数据集，也就是说输入数据元素会持续不断地进入到Streaming Job的处理过程中，但你仍然可以使用一个HDFS数据文件作为Streaming J

最低0.47元/天解锁文章

ReinhardHoneckerHans

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
flink 写入到es_10年大数据专家，使用Flink实现索引数据到Elasticsearch，快来学

前言使用Flink处理数据时，可以基于Flink提供的批式处理(Batch Processing)和流式处理(Streaming Processing)API来实现，分别能够满足不同场景下应用数据的处理。这两种模式下，输入处理都被抽象为Source Operator，包含对应输入数据的处理逻辑；输出处理都被抽象为Sink Operator，包含了对应输出数据的处理逻辑。这里，我们只关注输出的Sin...
复制链接

扫一扫