fink 初相识

最新推荐文章于 2024-04-30 17:01:14 发布

下山化缘的DJ

最新推荐文章于 2024-04-30 17:01:14 发布

阅读量126

点赞数

文章标签： flink java

原文链接：https://www.cnblogs.com/javazhiyin/p/13597319.html

版权

一、 flink从开发步骤的角度来讲，主要有四大部分
在这里插入图片描述
1.环境：Environment
Flink Job在提交执行计算时，需要首先建立和Flink框架之间的联系，也就指的是当前的flink运行环境，只有获取了环境信息，才能将task调度到不同的taskManager执行。而这个环境对象的获取方式相对比较简单。

// 批处理环境
val env = ExecutionEnvironment.getExecutionEnvironment
// 流式数据处理环境
val env = StreamExecutionEnvironment.getExecutionEnvironment

2.数据源 Source
Flink框架可以从不同的来源获取数据，将数据提交给框架进行处理, 我们将获取数据的来源称之为数据源。
在这里插入图片描述

2.1 从集合读取数据
一般情况下，可以将数据临时存储到内存中，形成特殊的数据结构后，作为数据源使用。这里的数据结构采用集合类型是比较普遍的。
2.2 从文件中读取数据
通常情况下，我们会从存储介质中获取数据，比较常见的就是将日志文件作为数据源。
2.3 从kafka读取数据
Kafka 和 Flink成为构建一个实时的数据处理系统的首选
2.4 自定义数据源
flink也提供了能自定义数据源的方式。

3.Transform
在Spark中，算子分为转换算子和行动算子，转换算子的作用可以通过算子方法的调用将一个RDD转换另外一个RDD，Flink中也存在同样的操作，可以将一个数据流转换为其他的数据流。
转换过程中，数据流的类型也会发生变化，那么到底Flink支持什么样的数据类型呢，其实我们常用的数据类型，Flink都是支持的。比如：Long, String, Integer, Int, 元组，样例类，List, Map等。
在这里插入图片描述
4. Sink
Sink有下沉的意思，在Flink中所谓的Sink其实可以表示为将数据存储起来的意思，也可以将范围扩大，表示将处理完的数据发送到指定的存储系统的输出操作

之前我们一直在使用的print方法其实就是一种Sink。
在这里插入图片描述
5.转载

下山化缘的DJ

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
fink 初相识

一、 flink从开发步骤的角度来讲，主要有四大部分1.环境：EnvironmentFlink Job在提交执行计算时，需要首先建立和Flink框架之间的联系，也就指的是当前的flink运行环境，只有获取了环境信息，才能将task调度到不同的taskManager执行。而这个环境对象的获取方式相对比较简单。// 批处理环境val env = ExecutionEnvironment.getExecutionEnvironment// 流式数据处理环境val env = StreamExecut
复制链接

扫一扫

fink 初相识

“相关推荐”对你有帮助么？