Flink1.10使用过程中的一些认知
关于TaskManager/Slot/JobMangaer的认知
上节说过,Flink的3种部署模式。我们选择了Flink on YARN。但是经常听小伙伴抱怨说job不稳定,崩溃,有时候提交任务失败等等;
所以,今天专门针对于基本概念重新认识一下Flink;
脚本
我们的脚本类似于下面这种。没有任何附加参数:
nohup bin/flink run -m yarn-cluster -s hdfs:///flink/savepoints/savepoint-* -c *.* jars/**** test > Flink-RealtimeDAU.log 2>&1 &
运行到yarn中之后的效果:
下面这3个,使用了2个Containers,Allocated Memory是4G的就是了。
但是,我们的Job很简单,而且也不存在大量的内存计算一说,所以,这个很显然比较浪费。
于是先从Yarn入手,这个Container是干啥的?可以有多少个?