flink学习笔记1—基础和架构

  1. datastream的keyby是按当前key的hashcode对数据重新分区

  2. stream输出前面的4>代表当前并行执行的线程编号,也可以认为是真分布式时对应的分区编号在这里插入图片描述

  3. 可以用flink自带的ParameterTool提取配置项在这里插入图片描述

  4. bin目录里的flink文件功能是:启动集群后,所有命令行操作都能用它在这里插入图片描述

  5. jobmanager在这里插入图片描述

  6. taskmanager向resourcemanager注册slot数量,每个taskmanager都是一个JVM进程,resourcemanager管理slot,还可以和外部交互,如K8S,YARN

  7. 任务提交流程在这里插入图片描述

  8. 并行子任务必须分开,如图里的source;先后发生的子任务可以共享一个slot,如source和windows。每个子任务是一个线程![在这里插入图片描述](https://img-blog.csdnimg.cn/20210303170500659.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjEyNjk2Mg==,size_16,color_FFFFFF,t_70

  9. 可以通过设置共享组.slotSharingGroup(“name”)来让不同顺序的子任务,占单独的slot,不设置的话默认在default共享组里

  10. 从代码到执行图的过程在这里插入图片描述

  11. 为什么在DAG里看到有些任务合并(同一个共享组才能合并)了,比如source和map。在这里插入图片描述

  12. flatmap和keyby涉及到重分区操作,不是one-to-one,所以不能合并,在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值