1、flume的组件有哪些?
source组件,channel组件,sink组件
2、sql怎么优化
(1)、创建索引时,尽量避免全表扫描
(2)、避免在索引上使用计算
(3)、尽量使用参数化sql
(4)、尽量将多条SQL语句压缩到一句sql中
(5)、用where字句替换Having字句
(6)、连接多个表时,使用表的别名
(7)、尽量避免使用游标等等
3、宽窄依赖
窄依赖:父RDD的一个分区只能被子RDD的一个分区所依赖
宽依赖:父RDD的一个分区会被子RDD的多个分区所依赖
4、闭包
方法体中,匿名函数的运算调用了方法的参数列表
5、柯里化
将原来一次传入两个参数的函数转为一次传入一个参数的函数
6、spark的执行流程
7、flink在Yarn模式下提交流程
具体步骤: