一、填空题
1、Hadoop集群部署方式分别是 独立模式 、 伪分布式模式 和 完全分布式模式 。
2、加载环境变量配置文件需要使用 source /etc/profile 命令。
3、格式化HDFS集群命令是 hadoop namenode -format 。
4、脚本一键启动Hadoop集群服务命令是 start-all.sh 。
5、Hadoop默认开设HDFS文件系统端口号 50070 和监控Yarn集群端口号 8088 。
二、判断题
1、Hadoop是Java语言开发的,因此在搭建Hadoop集群时,需要为集群安装JDK环境变量。(√)
2、伪分布式模式下的Hadoop功能与完全分布式模式下的Hadoop功能相同。(√)
3、启动Hadoop集群服务之前需要格式化文件系统。(√)
4、Hadoop存在多个副本,且默认备份数量是3。(√)
5、配置Hadoop集群只需要修改core-site.xml配置文件就可以。(×)
三、选择题
1、HDFS默认备份数量?( D )
A、0 B、1 C、2 D、3
2、下列描述说法错误的是? ( B )
A、SecureCRT是一款支持SSH的终端仿真程序,它能够在Windows操作系统上远程连接Linux服务器执行操作。
B、Hadoop是一个用于处理大数据的分布式集群架构,支持在GNU/Linux系统以及Windows系统上进行安装使用。
C、VMware Workstation是一款虚拟计算机的软件,用户可以在单一的桌面上同时操作不同的操作系统。
D、 SSH是一个软件,专为远程登录会话和其他网络服务提供安全性功能的软件。
3、配置Hadoop集群时,下列哪个Hadoop配置文件需要进行修改?(多选) ( AC )
A、hadoop-env.sh B、profile C、core-site.xml D、ifcfg-eth0
五、简答题
1、简述什么是SSH以及SSH协议解决的问题。
答:SSH为Secure Shell的缩写,它是一种网络安全协议,专为远程登录会话和其他网络服务提供安全性的协议。通过使用SSH服务,可以把传输的数据进行加密,有效防止远程管理过程中的信息泄露问题。
2、简述Hadoop集群部署方式以及各方式使用场景。
答:①独立模式:又称为单机模式,在该模式下,无需运行任何守护进程,所有的程序都在单个JVM上执行。独立模式下调试Hadoop集群的MapReduce程序非常方便,所以一般情况下,该模式在学习或者开发阶段调试使用。
②伪分布式模式:Hadoop程序的守护进程运行在一台节点上,通常使用伪分布式模式用来调试Hadoop分布式程序的代码,以及程序执行是否正确,伪分布式模式是完全分布式模式的一个特例。
③完全分布式模式:Hadoop的守护进程分别运行在由多个主机搭建的集群上,不同节点担任不同的角色,在实际工作应用开发中,通常使用该模式构建企业级Hadoop系统。