Flink核心概念

本文介绍了Flink的核心概念,包括Basic API Concepts、DataSet和DataStream的区别,以及Flink程序的执行流程。重点阐述了Flink的Lazy Evaluation特性,解释了Flink程序如何在分布式环境中进行批处理和流处理,并提供了基本的程序执行步骤。
摘要由CSDN通过智能技术生成

1、Basic API Concepts

  • Flink程序是在分布式集合上实现转换的常规程序(例如,filtering, mapping, updating state, joining, grouping, defining windows, aggregating)。集合最初是从源创建的(例如,从文件、kafka主题或本地内存集合中读取)。结果通过接收器返回,例如,接收器可以将数据写入(分布式)文件,或者写入标准输出(例如,命令行终端)。Flink程序在各种上下文中运行,独立运行或嵌入到其他程序中。执行可以在本地JVM中进行,也可以在许多机器的集群上进行。
  • 根据数据源的类型,即有界(bounded)或无界(unbounded)数据源,您可以编写一个批处理程序或流处理程序,其中DataSet API用于批处理,DataStream API用于流处理。

2、DataSet and DataStream

  • Flink有特殊的类DataSet和DataStream来表示程序中的数据。您可以将它们看作是不可变的数据集合,可以包含重复的数据。在DataSet的情况下,数据是有限的,而对于DataStream,元素的数量可以是无界的。

3、Flink程序的剖析

Flink程序看起来像转换数据集合的常规程序。每个程序都由相同的基本部分组成:

  • 获取一个执行环境
  • 加载/创建初始数据
  • 指定对该数据的转换
  • 指定将计算结果放在何处
  • 触发程序执行

Str

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值