一. 单选题(共10题,50分)
- (单选题)分布式文件系统指的是什么?
A. 把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
B. 用于在Hadoop与传统数据库之间进行数据传递
C. 一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统
D. 一种高吞吐量的分布式发布订阅消息系统,可以处理消费者规模的网站中的所有动作流数据
我的答案: A:把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群;
正确答案: A:把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群;
5分 - (单选题)下面哪一项不属于计算机集群中的节点?
A. 主节点(Master Node)
B. 源节点(SourceNode)
C. 名称结点(NameNode)
D. 从节点(Slave Node)
我的答案: B:源节点(SourceNode);
正确答案: B:源节点(SourceNode);
5分 - (单选题)在HDFS中,默认一个块多大?
A. 64MB
B. 32KB
C. 128KB
D. 16KB
我的答案: A:64MB;
正确答案: A:64MB;
5分 - (单选题)下列哪一项不属于HDFS采用抽象的块概念带来的好处?
A. 简化系统设计
B. 支持大规模文件存储
C. 强大的跨平台兼容性
D. 适合数据备份
我的答案: C:强大的跨平台兼容性;
正确答案: C:强大的跨平台兼容性;
5分 - (单选题)在HDFS中,NameNode的主要功能是什么?
A. 维护了block id 到datanode本地文件的映射关系
B. 存储文件内容
C. 文件内存保存在磁盘中
D. 存储元数据
我的答案: A:维护了block id 到datanode本地文件的映射关系;
正确答案: D:存储元数据;
0分 - (单选题)下面对FsImage的描述,哪个是错误的?
A. FsImage文件没有记录每个块存储在哪个数据节点
B. FsImage文件包含文件系统中所有目录和文件inode的序列化形式
C. FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
D. FsImage文件记录了每个块具体被存储在哪个数据节点
我的答案: D:FsImage文件记录了每个块具体被存储在哪个数据节点;
正确答案: D:FsImage文件记录了每个块具体被存储在哪个数据节点;
5分 - (单选题)下面对SecondaryNameNode第二名称节点的描述,哪个是错误的?
A. SecondaryNameNode一般是并行运行在多台机器上
B. 它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
C. SecondaryNameNode通过HTTPGET方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下
D. SecondaryNameNode是HDFS架构中的一个组成部分
我的答案: A:SecondaryNameNode一般是并行运行在多台机器上;
正确答案: A:SecondaryNameNode一般是并行运行在多台机器上;
5分 - (单选题)HDFS采用了什么模型?
A. 分层模型
B. 主从结构模型
C. 管道-过滤器模型
D. 点对点模型
我的答案: B:主从结构模型;
正确答案: B:主从结构模型;
5分 - (单选题)在Hadoop项目结构中,HDFS指的是什么?
A. 分布式文件系统
B. 流数据读写
C. 资源管理和调度器
D. Hadoop上的数据仓库
我的答案: A:分布式文件系统;
正确答案: A:分布式文件系统;
5分 - (单选题)下列关于HDFS的描述,哪个不正确?
A. HDFS还采用了相应的数据存放、数据读取和数据复制策略,来提升系统整体读写响应性能
B. HDFS采用了主从(Master/Slave)结构模型
C. HDFS采用了冗余数据存储,增强了数据可靠性
D. HDFS采用块的概念,使得系统的设计变得更加复杂
我的答案: D:HDFS采用块的概念,使得系统的设计变得更加复杂;
正确答案: D:HDFS采用块的概念,使得系统的设计变得更加复杂;
5分
二. 多选题(共10题,50分) - (多选题)HDFS要实现以下哪几个目标?
A. 兼容廉价的硬件设备
B. 流数据读写
C. 大数据集
D. 复杂的文件模型
我的答案: ABC:兼容廉价的硬件设备; 流数据读写; 大数据集;
正确答案: ABC:兼容廉价的硬件设备; 流数据读写; 大数据集;
5分 - (多选题)HDFS特殊的设计,在实现优良特性的同时,也使得自身具有一些应用局限性,主要包括以下哪几个方面?
A. 较差的跨平台兼容性
B. 无法高效存储大量小文件
C. 不支持多用户写入及任意修改文件
D. 不适合低延迟数据访
我的答案: BCD:无法高效存储大量小文件; 不支持多用户写入及任意修改文件; 不适合低延迟数据访;
正确答案: BCD:无法高效存储大量小文件; 不支持多用户写入及任意修改文件; 不适合低延迟数据访;
5分 - (多选题)HDFS采用抽象的块概念可以带来以下哪几个明显的好处?
A. 支持大规模文件存储
B. 支持小规模文件存储
C. 适合数据备份
D. 简化系统设计
我的答案: ACD:支持大规模文件存储; 适合数据备份; 简化系统设计;
正确答案: ACD:支持大规模文件存储; 适合数据备份; 简化系统设计;
5分 - (多选题)在HDFS中,名称节点(NameNode)主要保存了哪些核心的数据结构?
A. FsImage
B. DN8
C. Block
D. EditLog
我的答案: AD:FsImage; EditLog;
正确答案: AD:FsImage; EditLog;
5分 - (多选题)数据节点(DataNode)的主要功能包括哪些?
A. 负责数据的存储和读取
B. 根据客户端或者是名称节点的调度来进行数据的存储和检索
C. 向名称节点定期发送自己所存储的块的列表
D. 用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
我的答案: ABC:负责数据的存储和读取; 根据客户端或者是名称节点的调度来进行数据的存储和检索; 向名称节点定期发送自己所存储的块的列表;
正确答案: ABC:负责数据的存储和读取; 根据客户端或者是名称节点的调度来进行数据的存储和检索; 向名称节点定期发送自己所存储的块的列表;
5分 - (多选题)HDFS的命名空间包含什么?
A. 磁盘
B. 文件
C. 块
D. 目录
我的答案: BCD:文件; 块; 目录;
正确答案: BCD:文件; 块; 目录;
5分 - (多选题)下列对于客服端的描述,哪些是正确的?
A. 客户端是用户操作HDFS最常用的方式,HDFS在部署时都提供了客户端
B. HDFS客户端是一个库,暴露了HDFS文件系统接口
C. 严格来说,客户端并不算是HDFS的一部分
D. 客户端可以支持打开、读取、写入等常见的操作
我的答案: ABCD:客户端是用户操作HDFS最常用的方式,HDFS在部署时都提供了客户端; HDFS客户端是一个库,暴露了HDFS文件系统接口; 严格来说,客户端并不算是HDFS的一部分; 客户端可以支持打开、读取、写入等常见的操作;
正确答案: ABCD:客户端是用户操作HDFS最常用的方式,HDFS在部署时都提供了客户端; HDFS客户端是一个库,暴露了HDFS文件系统接口; 严格来说,客户端并不算是HDFS的一部分; 客户端可以支持打开、读取、写入等常见的操作;
5分 - (多选题)HDFS只设置唯一一个名称节点,这样做虽然大大简化了系统设计,但也带来了哪些明显的局限性?
A. 命名空间的限制
B. 性能的瓶颈
C. 隔离问题
D. 集群的可用性
我的答案: ABCD:命名空间的限制; 性能的瓶颈; 隔离问题; 集群的可用性;
正确答案: ABCD:命名空间的限制; 性能的瓶颈; 隔离问题; 集群的可用性;
5分 - (多选题)HDFS数据块多副本存储具备以下哪些优点?
A. 加快数据传输速度
B. 容易检查数据错误
C. 保证数据可靠性
D. 适合多平台上运行
我的答案: ABC:加快数据传输速度; 容易检查数据错误; 保证数据可靠性;
正确答案: ABC:加快数据传输速度; 容易检查数据错误; 保证数据可靠性;
5分 - (多选题)HDFS具有较高的容错性,设计了哪些相应的机制检测数据错误和进行自动恢复?
A. 数据源太大
B. 数据节点出错
C. 数据出错
D. 名称节点出错
我的答案: BCD:数据节点出错; 数据出错; 名称节点出错;
正确答案: BCD