周润发的大数据

本文详细介绍了大数据技术中的Hadoop和HBase。内容涵盖Hadoop的特性、组件、工作流程,以及HDFS和MapReduce的相关知识。同时,对HBase的数据存储、管理、查询等方面进行了深入探讨,包括HBase与Hadoop的集成、HBase的表结构、数据操作等。文章通过一系列选择题和填空题的形式,全面展示了Hadoop和HBase在大数据处理中的核心概念和应用场景。
摘要由CSDN通过智能技术生成


一、单选

1下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能?
A、利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理
B、利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C、构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全
D、把实时采集的数据作为流计算系统的输入,进行实时处理分析
我的答案:A

2下列哪个不属于Hadoop的特性?
A、成本高
B、高可靠性
C、高容错性
D、运行在Linux平台上
我的答案:A

3 Hadoop框架中最核心的设计是什么?
A、为海量数据提供存储的HDFS和对数据进行计算的MapReduce
B、提供整个HDFS文件系统的NameSpace(命名空间)管理、块管理等所有服务
C、Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
D、Hadoop被视为事实上的大数据处理标准
我的答案:A

4在一个基本的Hadoop集群中,DataNode主要负责什么?
A、负责执行由JobTracker指派的任务
B、协调数据计算任务
C、负责协调集群中的数据存储
D、存储被拆分的数据块
我的答案:D

5 Hadoop最初是由谁创建的?
A、Lucene
B、Doug Cutting
C、Apache
D、MapReduce
我的答案:B

6下列哪一个不属于Hadoop的大数据层的功能?
A、数据挖掘
B、离线分析
C、实时计算
D、BI分析
我的答案:C

7在一个基本的Hadoop集群中,SecondaryNameNode主要负责什么?
A、帮助NameNode收集文件系统运行的状态信息
B、负责执行由JobTracker指派的任务
C、协调数据计算任务
D、负责协调集群中的数据存储
我的答案:A

8下面哪一项不是Hadoop的特性?
A、可扩展性高
B、只支持少数几种编程语言
C、成本低
D、能在linux上运行
我的答案:B

9在Hadoop项目结构中,HDFS指的是什么?
A、分布式文件系统
B、分布式并行编程模型
C、资源管理和调度器
D、Hadoop上的数据仓库
我的答案:A

10在Hadoop项目结构中,MapReduce指的是什么?
A、分布式并行编程模型
B、流计算框架
C、Hadoop上的工作流管理系统
D、提供分布式协调一致性服务
我的答案:A

11下面哪个不是Hadoop1.0的组件:( )
A、HDFS
B、MapReduce
C、YARN
D、NameNode和DataNode
我的答案:C

12分布式文件系统指的是什么?
A、把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
B、用于在Hadoop与传统数据库之间进行数据传递
C、一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统
D、一种高吞吐量的分布式发布订阅消息系统,可以处理消费者规模的网站中的所有动作流数据
我的答案:A

13下面哪一项不属于计算机集群中的节点?
A、主节点(Master Node)
B、源节点(SourceNode)
C、名称结点(NameNode)
D、从节点(Slave Node)
我的答案:B

14在Hadoop2.0以上版本中,HDFS中,默认一个块多大?
A、128MB
B、32KB
C、128KB
D、16KB
我的答案:A

15下列哪一项不属于HDFS采用抽象的块概念带来的好处?
A、简化系统设计
B、支持大规模文件存储
C、强大的跨平台兼容性
D、适合数据备份
我的答案:C

16在HDFS中,NameNode的主要功能是什么?
A、维护了block id 到datanode本地文件的映射关系
B、存储文件内容
C、文件内存保存在磁盘中
D、存储元数据
我的答案:D

17下面对FsImage的描述,哪个是错误的?
A、FsImage文件没有记录每个块存储在哪个数据节点
B、FsImage文件包含文件系统中所有目录和文件inode的序列化形式
C、FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
D、FsImage文件记录了每个块具体被存储在哪个数据节点
我的答案:D

18下面对SecondaryNameNode第二名称节点的描述,哪个是错误的?
A、SecondaryNameNode一般是并行运行在多台机器上
B、它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
C、SecondaryNameNode通过HTTPGET方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下
D、SecondaryNameNode是HDFS架构中的一个组成部分
我的答案:A

19 HDFS采用了什么模型?
A、分层模型
B、主从结构模型
C、管道-过滤器模型
D、点对点模型
我的答案:B

20在Hadoop项目结构中,HDFS指的是什么?
A、分布式文件系统
B、流数据读写
C、资源管理和调度器
D、Hadoop上的数据仓库
我的答案:A

21下列关于HDFS的描述,哪个不正确?
A、HDFS还采用了相应的数据存放、数据读取和数据复制策略,来提升系统整体读写响应性能
B、HDFS采用了主从(Master/Slave)结构模型
C、HDFS采用了冗余数据存储,增强了数据可靠性
D、HDFS采用块的概念,使得系统的设计变得更加复杂
我的答案:D

22下列关于BigTable的描述,哪个是错误的?
A、爬虫持续不断地抓取新页面,这些页面每隔一段时间地存储到BigTable里
B、BigTable是一个分布式存储系统
C、BigTable起初用于解决典型的互联网搜索问题
D、网络搜索应用查询建立好的索引,从BigTable得到网页
我的答案:A

23下列选项中,关于HBase和BigTable的底层技术对应关系,哪个是错误的?
A、GFS与HDFS相对应
B、GFS与Zookeeper相对应
C、MapReduce与Hadoop MapReduce相对应
D、Chubby与Zookeeper相对应
我的答案:B

24在HBase中,关于数据操作的描述,下列哪一项是错误的?
A、HBase采用了更加简单的数据模型,它把数据存储为未经解释的字符串
B、HBase操作不存在复杂的表与表之间的关系
C、HBase不支持修改操作
D、HBase在设计上就避免了复杂的表和表之间的关系
我的答案:C

25 Pig主要用在哪个场合?
A、适合Hadoop MapReduce作业并行批处理HBase表数据
B、适合HBase管理使用
C、适合其他异构系统在线访问HBase表数据
D、适合做数据统计
我的答案:A

26 HBase中需要根据某些因素来确定一个单元格,这些因素可以视为一个“四维坐标”,下面哪个不属于“四维坐标”?
A、行键
B、关键字
C、列族
D、时间戳
我的答案:B

27关于HBase的三层结构中各层次的名称和作用的说法,哪个是错误的?
A、Zookeeper文件记录了用户数据表的Region位置信息
B、-ROOT-表记录了.META.表的Region位置信息
C、.META.表保存了HBase中所有用户数据表的Region位置信息
D、Zookeeper文件记录了-ROOT-表的位置信息
我的答案:A

28下面关于主服务器Master主要负责表和Region的管理工作的描述,哪个是错误的?
A、在Region分裂或合并后,负责重新调整Region的分布
B、对发生故障失效的Region服务器上的Region进行迁移
C、管理用户对表的增加、删除、修改、查询等操作
D、不支持不同Region服务器之间的负载均衡
我的答案:D

29 HBase只有一个针对行健的索引,如果要访问HBase表中的行,下面哪种方式是不可行的?
A、通过单个行健访问
B、通过时间戳访问
C、通过一个行健的区间来访问
D、全表扫描
我的答案:B

30下面关于Region的说法,哪个是错误的?
A、同一个Region不会被分拆到多个Region服务器
B、为了加快访问速度,.META.表的全部Region都会被保存在内存中
C、一个-ROOT-表可以有多个Region
D、为了加速寻址,客户端会缓存位置信息,同时,需要解决缓存失效问题
我的答案:C

31下列哪个不属于NoSQL数据库的特点?
A、灵活的可扩展性
B、灵活的数据模型
C、与云计算紧密融合
D、数据存储规模有限
我的答案:D

32下面关于NoSQL和关系数据库的简单比较,哪个是错误的?
A、RDBMS有关系代数理论作为基础,NoSQL没有统一的理论基础
B、NoSQL很难实现横向扩展,RDBMS可以很容易通过添加更多设备来支持更大规模的数据
C、RDBMS需要定义数据库模式,严格遵守数据定义,NoSQL一般不存在数据库模式,可以自由灵活定义并存储各种不同类型的数据
D、RDBMS借助于索引机制可以实现快速查询,很多NoSQL数据库没有面向复杂查询的索引
我的答案:B

33下列哪一项不属于NoSQL的四大类型?
A、文档数据库
B、图数据库
C、列族数据库
D、时间戳数据库
我的答案:D

34下列关于键值数据库的描述,哪一项是错误的?
A、扩展性好,灵活性好
B、大量写操作时性能高
C、无法存储结构化信息
D、条件查询效率高
我的答案:D

35下列关于列族数据库的描述,哪一项是错误的?
A、查找速度慢,可扩展性差
B、功能较少,大都不支持强事务一致性
C、容易进行分布式扩展
D、复杂性低
我的答案:A

36下面关于MongoDB说法,哪一项是正确的?
A、具有较差的水平可扩展性
B、设置个别属性的索引来实现更快的排序
C、提供了一个面向文档存储,操作复杂
D、可以实现替换完成的文档(数据)或者一些指定的数据字段
我的答案:D

37下列关于NoSQL与关系数据库的比较,哪个说法是错误的?
A、在一致性方面,RDBMS强于NoSQL
B、在数据完整性方面,RDBMS容易实现
C、在扩展性方面,NoSQL 比较好
D、在可用性方面,NoSQL优于RDBMS
我的答案:D

38关于文档数据库的说法,下列哪一项是错误的?
A、数据是规则的
B、性能好(高并发)
C、缺乏统一的查询语法
D、复杂性低
我的答案:A

39下列关于

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值