(先做题--题放最后)
1.把一个表插另外一个表
2.hadoop有哪些组件,作用的一系列
3.yarn的任务调度(我没印象)
Hadoop作业调度器主要有三种:FIFO、容量(Capacity Scheduler)和公平(Fair Scheduler)。
Apache Hadoop3.3.4默认的资源调度器是Capacity Scheduler。
CDH框架默认调度器是Fair Scheduler。
3.hive的底层
4.spark这一块,spark的关联方式
5.大表join小表
6.hive优化
7.广播传播
8.问项目