1、Hadoop 特性优点?
(1)扩容能力
(2)成本低
(3)高效率
(4)可靠性
2、Hadoop的核心组件是哪些?
(1)HDFS
(2)MapReduce
(3)Yarn
3、Hadoop目前有几个版本?
目前hadoop有1.x、2.x、3.x。三个版本
4、HDFS分布式文件系统集群的角色主要有?
NameNode、DataNode、SecondaryNameNode
5、Yarn资源调度系统集群的主要角色是哪些?
ResourceManager、NodeManager
6、Hadoop部署的方式分别是哪几种?
Standalone mode(独立模式)
Pseudo-Distributed mode(伪分布式模式)
Cluster mode(群集模式)
7、网络同步时间的命令?
ntpdate cn.pool.ntp.org
8、设置主机名在哪一个文件中?
/etc/sysconfig/network
9、配置IP、主机名映射的文件是哪一个?
/etc/hosts
10、编译hadoop需要准备的步骤有哪些?
(1)准备linux环境
(2)虚拟机联网,关闭防火墙,关闭selinux
(3)安装jdk1.7
(4)安装maven
(5)安装findbugs
(6)在线安装一些依赖包
(7)安装protobuf
(8)安装snappy
(9)下载cdh源码准备编译
11、hadoop安装包目录包括哪些文件夹,各有什么作用?
(1)bin:Hadoop最基本的管理脚本和使用脚本的目录
(2)etc:Hadoop配置文件所在的目录
(3)include:对