一、Flink介绍
1、Flink是什么: Flink是为分布式、高性能、随时可用以及准确的流处理应用程序打造的开源流处理框架。是一个大数据处理引擎的处理框架,是针对流进行的处理. 它是Apache 旗下的一个框架和分布式的处理引擎,用于对无界和有界的数据进行状态的计算。
二、Flink的特点
1、事件驱动型
2、流与批的处理
3、分层API
三、Flink下载
https://mirrors.tuna.tsinghua.edu.cn/apache/flink/flink-1.18.0/
四、设置环境Flink环境变量
在path中配置对应的bin
进入flink的bin中执行命令
D:\bigdata\flink-1.18.0\bin>start-cluster.bat
Starting a local cluster with one JobManager process and one TaskManager process.
You can terminate the processes via CTRL-C in the spawned shell windows.
Web interface by default on http://localhost:8081/.
这样就说明启动成功了,可以进入提供的url界面。
http://localhost:8081/.
成功之后,就可以进行流式计算了。
四、Flink与Spark的区别
Spark是以批处理为主,并尝试在批处理之上支持流计算;Flink是以流处理为主,在流处理上支持批处理。Spark和Flink的主要区别就是计算模型不同,Spark采用了微批处理模型,而Flink采用了基于操作符的连续流模型。