1.cd 上一层和上一次目录
cd .. cd-
2.vi命令的三种模式
命令行 编辑 尾行
3.全局搜索只知道名称含有ruoze字母的
find / -name '*ruoze*'
4.union all 和union区别
union 去重 all是不去重
5.谈谈shuffle理解
比如一台机器key对应数据很多,比如一亿。另外一天机器key对应数据就1000,那么第一台忙死了,
第二台早就结束了。 要等待第一台计算完成,那么整个job才结束;这是木桶效应。
因为第一台的数据要从其他节点通过网络来传输
6.hive数据哪两种?分别存储在哪
元数据 mysql 生产数据 hdfs
7.hive执行引擎是什么
mr spark tez
8.hive启动之前需要哪些组件启动
hdfs yarn mysql ??
9.查看文件大小,文件夹大小命令
ll -h du -sh
10.系统负载,磁盘大小,内存大小命令
top df -h free -m
11.yarn命令去kill application,会吗
yarn application -kill jobId