Flink运行架构及相关命令
最近学习了Flink,整理了一些关于flink函数框架运行和相关算子的运算方法。
flink阿里17年开始开源blink,里面融合的部分flink功能,比如flink SQL
Flink项目的理念是:“Apache Flink是为分布式、高性能、随时可用以及准确的流处理应用程序打造的开源的有状态的流处理框架”。
Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算 。Flink被设计在所有常见的集群环境中运行,以内存执行速度和任意规模来执行计算。
状态相当于历史数据。
flink可以相当于三部分来学习。
相关运行命令
指令 | 功能 |
---|---|
Flink | 提交任务参数 |
flink | 执行任务脚本 |
run | 执行作业(ApplicationMode模式除外) |
run-application | ApplicationMode模式的执行作业 |
-d | 后台运行 |
-m | 指定JobManager |
-c | 指定全类名 |
-D | 如果要指定其它配置,可以跟在-D 后面 格式:(-D参数名=参数值) |
-t | 指定以yarn的什么模式,yarn-per-job yarn-session yarn-application |
-p | 提交任务时指定并行度 |
运行架构