1.hadoop广义狭义
广义:hadoop生态圈
狭义:hadoop软件,由hdfs ,mapreduce,yarn组成
2.hdfs哪三个进程
NM,DN,SNN
3.yarn哪两个进程
RM,NM
4.hdfs yarn默认web界面端口号
50070 8088
5.假如让你们改web界面端口号,请问怎么修改,去哪里找
官网文档,默认配置文件,一般就是那些xml文件
官网最下面找yarn-site.xml找http 关键字
找到对应参数,然后对应去xml文件修改
6.hdfs的NN是做什么的?
维护文件系统树
管理元数据,目录树
接受用户访问请求
保存fsimage
文件命名空间,管理文件名,目录结构,文件数据块在哪些DataNode上
7.hdfs 副本放置策略 简述
提交节点如果是dn,则放置在本节点,如果不是,找一个cpu不太繁忙,存储使用率较小的机器。第二个副本放置在与第一个节点不同机架的机器上,第三个副本放置在与第二个副本相同机架的不同节点上
8.一个文件130M,副本数3,块大小设为128M,请问多少块,多少实际存储空间要求
6 390
9.面试题:
hdfs读写流程 ,自己博客整理了没?
10.谈谈你对jps命令的理解( jps是哪里的命令,存储在哪,发现不可用怎么办)
查看pid以及进程名
查看java进程,进程详情
查看jvm进程信息
出现信息不可用时可以先ps-ef这些命令属于什么用户,切到那个用户下再查看是否真的不可用
11.谈谈对pid文件的理解
pid文件是进程临时文件,删除了对进程没影响,但会影响重启
12.你会哪些hdfs常用命令
/-ls /-put /-cat /-text /-rm -r/-mkdir /-mkdir -p/-cpToLocal/-cpFromLocal 常见的