一、基础知识
Flink有非常灵活的分层API设计,核心层就是DataStream/DataSet API。新版已经实现流批一体,DataSet API被弃用,统一使用DataStream API处理流数据和批数据。
DataStream本身是Flink中一个用来表示数据集合的类,Flink代码其实就是基于这种数据类型的处理。一个Flink程序,其实就是对DataStream的各种转换,具体来说,代码基本上都由以下几个部分组成:(1)获取执行环境 execution enviroment (2)读取数据源 source (3)定义基于数据的转换操作 transformations (4)定义计算结果的输出位置 sink (5)触发程序执行 execute。
其中第一部分的获取执行环境和第五部分的触发程序执行,都可以认为是对执行环境的操作,所以我们可以将其精简为下面四个部分:
- 执行环境 enrironment
- 数据源 source
- 转换操作 transformation
- 输出 sink

二、创建执行环境
flink程序的第一步就是创建执行环境,这是flink程序的基础。
在代码中创建执行环境,就是调用这个类的静态方法,具体有以下三种形式:
- getExecutionEnvironment()

最低0.47元/天 解锁文章
1785

被折叠的 条评论
为什么被折叠?



