大数据个人面经
一、萌新网络
1.简单的问了一些hpl中的一些函数,比如行转列,列转行,还有row_number窗口函数基本应用
2.yarn任务的调度方式
3.大概数据量
二、撼策科技
1.谈一谈个人对spark的理解
2.一些shell linux指令,比如 查询端口 netstat nltp | grep 端口号
3.hpl的优化
4.hive优化
三、合胜
1.spark sql运行慢,怎么优化
2.hbase原理
3.mysql存储过程
4.linux常用指令
5.hadoop配置文件及其作用
6.kafka怎么保证数据进出顺序,答案:一个kafka分区
7.hdfs压缩方式和文件格式
8.es
9.数据倾斜是怎么发现并查看的