1.自我介绍,讲项目(主要讲怎么做的,解决哪些问题)
2.HiveSQL的执行流程(这个我理解错意了,理解成hivesql真正执行的顺序(运行顺序了!!!))
3.hive的数据源有哪些?
4.linux命令(基础命令)
5.sql一个逻辑过程(sql竹盖不能)
6.搭建集群过程中遇到问题,关于组件信息
7.分桶表和分区表的区别,分桶表的设计未来解决什么问题
8.redis用过吗,在项目中用来干什么
9.用的mysql哪个版本?数据库用什么?
10.ETL开发流程和设计
11.你遇到的问题有哪些?开发过程中
12.会写脚本不?
13.spark rdd, dataframe, dataSe解释一下
14.map reduce的原理
15.你有啥想问的不?