Hadoop技术与应用 第一章测验

Hadoop技术与应用

第一章测验

1、下面哪个选项不属于Google的三驾马车?

  HDFS

  MapReduce

  BigTable

  GFS

2、下面哪个思想是为了解决PageRank(网页排名)的问题?

  GFS

  BigTable

  MapReduce

  YARN

3、GFS 存储的文件都被分割成固定大小的块,每个块都会复制到多个块服务器上(可靠性),请问默认冗余存储几份?

  1

  2

  3

  5

4、下面哪个特点是不属于Hadoop的特点?

  扩容能力强

  成本低

  高效率和可靠性

  适合复杂数据的分析

5、下面哪个场景适合使用Hadoop处理?

  少量数据分析

  在线分析

  离线分析

  复杂数据

6、2003年,Google公司发表了主要讲解海量数据的可靠存储方法的论文是?

  “The Google File System”

  “MapReduce: Simplified Data Processing on Large Clusters”

  “Bigtable: A Distributed Storage System for Structured Data”

  “The Hadoop File System”

7、2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?

  “The Google File System”

  “MapReduce: Simplified Data Processing on Large Clusters”

  “Bigtable: A Distributed Storage System for Structured Data”

  “The Hadoop File System”

8、2006年,Google公司发表了用来处理海量数据的一种非关系型数据库的论文是?

  “The Google File System”

  “MapReduce: Simplified Data Processing on Large Clusters”

  “Bigtable: A Distributed Storage System for Structured Data”

  “The Hadoop File System”

9、对于GFS架构,下面哪个说法是错误的?

  GFS Master节点管理所有的文件系统所有数据块。

  GFS存储的文件都被分割成固定大小的块,每个块都会被复制到多个块服务器上(可靠性)。块的冗余度默认为3。

  GFS Master还管理着系统范围内的活动,比如块服务器之间的数据迁移等

  GFS Master与每个块服务器通信(发送心跳包),发送指令,获取状态

10、狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台,不包括下面哪个组件?

  HDFS

  MapReduce

  Yarn

  HBase

11、与Hadoop 1.x相比,Hadoop 2.x采用全新的架构,最明显的变化就是增加了哪个组件?

  MapReduce

  Yarn

  Pig

  HBase

12、建立在Hadoop文件系统之上的分布式的列式数据库?

  HBase

  Hive

  YARN

  Mahout

13、下面哪个选项不是HDFS架构的组成部分?

  NameNode

  DataNode

  SecondaryNameNode

  GFS

14、Hadoop的作者是?

  Doug cutting

  Martin Fowler

  Kent Beck

  No answer text provided.

15、Hadoop版本演进过程中,0比Hadoop1.0有了很多的优化,下面哪项不属于Hadoop2.0?

  加入HDFS的 NameNode Federation和YARN

  YARN基于cgroup的内存和磁盘IO隔离

  支持NameNode HA

  Wire-compatibility特性

16、Hadoop版本演进过程中,Hadoop3.0比Hadoop2.0有了很多的优化,下面哪项不属于Hadoop3.0?

  JDK版本的最低依赖从1.7变成了1.8

  支持多个Standby状态的NameNode

  支持NameNode HA

  Datanode内部添加了负载均衡

17、Hadoop更适合哪些场景?

  离线分析

  复杂数据

  少量数据

  在线分析

18、下面哪些是大数据的基本特征?

  数据体量大

  数据类型多

  处理速度快

  价值密度低

19、Hadoop能够使用户轻松开发和运行处理大数据的应用程序,那它主要有下面哪些特点?

  高可靠性

  高扩展性

  高效性

  高容错性

20、Google的在大数据解决方案是开源的。

  True

  False

21、GFS分布式文件系统有两个基本组成部分,一个是客户端(Client),一个是服务端(Server)。

  True

  False

22、上传的数据块保存在GFS上,在保存过程中需要水平复制,水平复制需要考虑两个要求:可靠性、可用性。

  True

  False

23、HDFS的采用了“分而治之”的思想。

  True

  False

24、MapReduce是的最早提出是Google为了解决PageRank的问题。

  True

  False

25、Hbase是非关系型数据库,是面向列的。

  True

  False

26、Hadoop源自始于2002年的Apache Lucene项目。

  True

  False

17、Google的论文《Google File System》提到:还依赖一个高可用的、序列化的分布式锁服务组件,叫Chubby。

  True

  False

28、Region Server是Google的论文《Bigtable:一个分布式的结构化数据存储系统》中描述的BigTable的组成部分。

  True

  False

29、Google的GFS论文是主要是为了解决PageRank(网页排名)的问题。

  True

  False

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值