HBASE,云数据库,hadoop,mapreduce

1下列关于UMP系统功能的说法,哪个是错误的?(2.0分)2.0 分
A、
UMP采用的两种资源隔离方式(用Cgroup限制MySQL进程资源和在Proxy服务器端限制QPS)
B、
UMP系统只设计了一种机制来保证数据安全
C、
UMP系统实现了对于用户透明的读写分离功能
D、
充分利用主从库实现用户读写操作的分离,实现负载均衡
正确答案: B 我的答案:B

UMP是低成本高性能的mysql云数据库,关键模板采用erlang实现

  • 提供单一入口来访问数据
  • 各种服务器资源划分为资源池,并以资源池为单位把资源分配给Mysql实例
  • 包含一系列组件,协同工作,提供主从热备、数据备份、迁移、容灾等服务
  • UMP系统实现资源虚拟化,降低整体成本
  • 通过“用Cgroup限制MYSQL进程资源”和在Proxy服务器限制QPS”,两种方式,实现资源隔离,按需分配,限制cpu,内存,i/o资源
  • 动态扩容和缩容
  • 采用ssl数据库连接、数据访问ip白名单,记录用户操作日志,sql拦截等技术,来有效保护用户的数据安全

每个用户都有两个mysql实例,即主库和从库,因此可以读写分离,实现负载均衡。

2
采用多副本冗余存储的优势不包含
(2.0分)2.0 分
A、
保证数据可靠性
B、
节约存储空间
C、
容易检查数据错误
D、
加快数据传输速度
正确答案: B 我的答案:B

3下列关于云数据库的描述,哪个是错误的?(2.0分)2.0 分
A、
云数据库价格不菲,维护费用极其昂贵
B、
云数据库是部署和虚拟化在云计算环境中的数据库
C、
云数据库具有高可扩展性、高可用性、采用多租形式和支持资源有效分发等特点
D、
云数据库是在云计算的大背景下发展起来的一种新兴的共享基础架构的方法
正确答案: A 我的答案:A

云数据库零成本,所有维护工作由云计算厂商负责

4
以下对Hadoop的说法错误的是
(2.0分)2.0 分
A、
Hadoop的核心是HDFS和MapReduce
B、
Hadoop2.0增加了NameNode HA和Wire-compatibility两个重大特性
C、
Hadoop MapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算
D、
Hadoop是基于Java语言开发的,只支持Java语言编程
正确答案: D 我的答案:D

hadoop2:HDFS Federation、YARN
hadoop3:HDFS可擦除编码、多名称结点支持、任务级别的Mapreduce本地优化、基于cgroup的内存、磁盘IO隔离

hadoop1hadoop2
hdfs:单一名称节点,存在单点失效问题HDFS HA 提供名称节点热备份机制
hdfs:单一命名空间,无法实现资源隔离设计了hdfs联邦,管理多个命名空间
mapreduce:资源管理效率低yarn:资源管理框架

5
下列哪一个不属于云数据库产品?
(2.0分)2.0 分
A、阿里云RDS
B、Oracle Cloud
C、百度云数据库
D、本地安装的MySQL
正确答案: D 我的答案:D

  • 待解决

6下列关于阿里云RDS的说法,哪个是错误的?(2.0分)2.0 分
A、
RDS具有安全稳定、数据可靠、自动备份
B、
RDS由专业数据库管理团队维护
C、
RDS是阿里云提供的关系型数据库服务

D、
RDS实例,是用户购买RDS服务的基本单位,在实例中,用户只能创建一个数据库
正确答案: D 我的答案:D

7下列哪个不是UMP系统中的角色?(2.0分)2.0 分
A、
Proxy服务器
B、
Controller服务器
C、
阿斯隆服务器
D、
愚公系统
正确答案: C 我的答案:c

  • mnesia:分布式数据库管理系统,支持事务,支持透明的数据分片,利用两阶段锁实现分布式事务,可以线性扩展到至少50个阶段
  • RabbitMQ:消息队列产品
  • ZooKeeper高效和可靠的协同工作系统:作为全局的配置服务器;提供分布式锁;监控所有Mysql实例
  • LVS:linux虚拟服务器,采用ip负载均衡技术和基于内容的请求分安抚技术,调度器是lvs的唯一入口点
  • Controller服务器:向ump集群提供各种管理服务,实现集体成员管理,原数据存储,等
  • web控制台
  • proxy服务器:提供访问mysql数据库服务
  • agent服务器:管理mysql实例
  • 日志分析服务器
  • 信息统计服务器
  • 愚公系统

8
以下哪个不是hadoop的特性
(2.0分)2.0 分
A、
高可靠性
B、
支持多种编程语言
C、
高容错性
D、
成本高
正确答案: D 我的答案:D

hadoop成本低,hadoop采用廉价的计算机集群,成本较低,普通用户也能容易的使用自己的pc搭建hadoop

10
能解决”单点故障问题“的是
(2.0分)0.0 分
A、
HDFS HA
B、
MapReduce
C、
HDFS 联邦
D、
Spark
正确答案: A 我的答案:B

名称节点是系统的核心结点:

  • 存储元数据信息
  • 负责管理文件系统的命名空间和客户端对文件的访问

hdfs1.0中的secondary namenode不是名称节点的备用结点功能是周期性从名称节点获取命名空间镜像文件fsimage和修改日志EditLog,防止EditLog过大,导致名称节点失败恢复是耗费过多时间。是冷备份,不是热备份。
无法提供热备份,故障时,无法立即切换提供服务,需要停机恢复

hdfs2.0采用high availability HA,一个namenode处于active,另一个处于standby,提供了热备份,一旦出现故障,立即切换到standby节点,不会影响对外服务

11
HDFS的命名空间不包含
(2.0分)2.0 分
A、
文件
B、
目录
C、

D、
字节
正确答案: D 我的答案:D

12
HBase中,浏览表的相关信息的shell命令是:
(2.0分)2.0 分
A、
list
B、
browse
C、
view
D、
scan
正确答案: D 我的答案:D

13下面哪一项不是云数据库的特性?(2.0分)2.0 分
A、
易用性
B、
动态可扩展
C、
高成本
D、
大规模并行处理
正确答案: C 我的答案:C

14
对HDFS通信协议的理解错误的是
(2.0分)2.0 分
A、
客户端通过一个可配置的端口向名称节点主动发起TCP连接,并使用客户端协议与名称节点进行交互
B、
客户端与数据节点的交互是通过RPC(Remote Procedure Call)来实现的
C、
HDFS通信协议都是构建在IoT协议基础之上的
D、
名称节点和数据节点之间则使用数据节点协议进行交互
正确答案: C 我的答案:C

1
Hadoop3.0中引入的重要功能和优化包
(2.0分)0.0 分
A、任务级别的MapReduce本地优化
B、
多名称节点支持
C、
基于cgroup的内存和磁盘IO隔离等
D、
HDFS可擦除编码
E、
增加了HDFS HA新特性
F、
新包含HDFS Federation和YARN两个系统
正确答案: ABCD 我的答案:ABCDF

2
HDFS中的NameNode节点用于存放元数据,数据内容包含()。
(2.0分)2.0 分
A、
文件与数据块的映射表
B、
数据块与数据节点的映射表
C、
每个数据块的内容
D、
客户端硬件配置数据
正确答案: AB 我的答案:AB

namenodedatanode
存储元数据存储文件内容
元数据保存在内存中文件内容保存在磁盘里
保存文件,块,datanode的映射关系维护了块和datanode的映射关系

3HDFS Federation 相对于HDFS1.0 的优势主要体现在哪里?(2.0分)2.0 分
A、
能够解决单点故障问题
B、
性能更高效
C、
良好的隔离性
D、
HDFS 集群扩展性
正确答案: BCD 我的答案:BCD

hdfs1.0中的问题:

  • 单点故障
  • 不可以水平扩展
  • 性能首先与单个namenode吞吐量
  • 单个namenode难以提供不同程序之间的隔离性

hdfs federation相对于hdfs1.0的优势:

  • hdfs集群扩展性:多名称节点,不在受制于内存
  • 新跟那个更加高效:多名称节点同时服务
  • 隔离性:多名称节点

hdfs不能解决单点故障问题
每个名称节点都有单点故障问题,所以需要对每个名称节点都部署一个后备名称节点

4在YARN体系结构中,ApplicationMaster主要功能包括哪些?(2.0分)2.0 分
A、
当用户作业提交时,ApplicationMaster与ResourceManager协商获取资源,ResourceManager会以容器的形式为ApplicationMaster分配资源
B、
向ResourceManager汇报作业的资源使用情况和每个容器的运行状态
C、
把获得的资源进一步分配给内部的各个任务(Map任务或Reduce任务),实现资源的“二次分配”
D、
定时向ResourceManager发送“心跳”消息,报告资源的使用情况和应用的进度信息
正确答案: ACD 我的答案:ACD

Application主要功能:

  • 当用户作业提交时,AplicationMater与resourcemanager协商获取资源,resourcemanager以容器的形式为application分配资源
  • 把获得的资源进一步分配给内部的各个任务(map或reduce任务),实现资源的二次分配
  • 与nodemanager保持通信进行应用程序的启动,运行,监控
  • 定时向resourcemanager发送心跳消息,报告资源使用情况和应用进度信息
  • 当作业完成时,application向resourcemanager注销容器,执行周期完成

6MapReduce相较于传统的并行计算框架有什么优势?(2.0分)2.0 分
A、
编程简单,只要告诉MapReduce做什么即可
B、
非共享式,容错性好
C、
普通PC机,便宜,扩展性好
D、
批处理、非实时、数据密集型
正确答案: ABCD 我的答案:ABCD

7UMP系统架构依赖的哪些开源组件?(2.0分)2.0 分
A、
ZooKeeper
B、
RabbitMQ
C、
LVS
D、
Mnesia
正确答案: ABCD 我的答案:ABCD

8Microsoft的云数据库产品SQL Azure具有以下哪些特性?(2.0分)2.0 分
A、
支持存储过程:它的数据类型、存储过程和传统的SQL Server具有很大的相似性
B、
支持云中的事务:支持局部事务,但是不支持分布式事务
C、
支持大量数据类型
D、
属于关系型数据库:支持使用TSQL来管理、创建和操作云数据库
正确答案: ABCD 我的答案:ABCD

SQL Azure特性:

  • 关系数据库:使用Transact-SQL来管理,创建,操作
  • 支持存储过程:应用可以在本地开发,然后部署到云品台上去
  • 支持大量数据类型
  • 支持云中事物:支持局部事务,但是不支持分布式事务
  • 未解决

10HDFS1.0 主要存在哪些问题?(2.0分)1.0 分
A、
不可以水平扩展
B、
系统整体性能受限于单个名称节点的吞吐量
C、
单个名称节点难以提供不同程序之间的隔离性
D、
单点故障问题
正确答案: BCD 我的答案:BC

9下列关于云数据库的描述,哪些是正确的?(2.0分)2.0 分
A、
Amazon是云数据库市场的先行者
B、
从数据模型的角度来说,云数据库并非一种全新的数据库技术
C、
Google Cloud SQL是谷歌公司推出的基于MySQL的云数据库
D、
云数据库并没有专属于自己的数据模型
正确答案: ABCD 我的答案:ABCD

1YARN 体系结构主要包括哪三部分?(2.0分)2.0 分
A、
ApplicationMaster
B、
DataManager
C、
ResourceManager
D、
NodeManager
正确答案: ACD 我的答案:ACD

12
MapReduce的两大核心组件包括:
(2.0分)2.0 分
A、
SSH
B、
JobTracker
C、
HDFS
D、
TaskTracker
正确答案: BD 我的答案:BD

14以下哪些是Amazon的云数据库产品?(2.0分)0.0 分
A、
Amazon RDS:云中的关系数据库
B、
Amazon SimpleDB:云中的键值数据库
C、
Amazon ElastiCache:云中的分布式内存缓存
D、
Amazon DynamoDB:云中的数据仓库
正确答案: ABD 我的答案:ABCD

Amazon 是云数据库市场的先行者,Amazon除了提供著名的S3存储服务和EC2计算服务意外,还提供了基于云的数据库服务:

  • Amazon RDS:云中的关系数据库
  • Amazon SimpleDB:云中的键值数据库
  • Amazon DynamoDB:云中的NoSQL数据库
  • Amazon Redshift:云中的数据仓库
  • Amazon ElastiCache:云中的分布式内存缓存

选项C是数据库服务,并不是数据库

15
以下对数据节点理解正确的是
(2.0分)2.0 分
A、
数据节点通常只有一个
B、
数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作
C、
数据节点用来存储具体的文件内容
D、
数据节点的数据保存在磁盘中
正确答案: BCD 我的答案:BCD

16
以下哪个命令可以用来操作HDFS文件
(2.0分)2.0 分
A、
hadoop dfs
B、
hdfs fs
C、
hdfs dfs
D、
hadoop fs
正确答案: ACD 我的答案:ACD

17下列关于UMP系统架构的描述,哪些是正确的?(2.0分)1.0 分
A、
信息统计服务器定期将采集到的用户的连接数
B、
UMP系统借助于LVS来实现集群内部的负载均衡
C、
LVS(Linux Virtual Server)即Linux虚拟服务器
D、
Web控制台无法向用户提供系统管理界面
正确答案: ABC 我的答案:AC

18
以下对名称节点理解正确的是(2.0分)2.0 分
A、
名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问
B、
名称节点通常用来保存元数据
C、
名称节点用来负责具体用户数据的存储
D、
名称节点的数据保存在内存中
正确答案: ABD 我的答案:ABD

19MapReduce的具体应用包括哪些?(2.0分)2.0 分
A、
矩阵乘法
B、
关系代数运算(选择、投影、并、交、差、连接)
C、
矩阵-向量乘法
D、
分组与聚合运算
正确答案: ABCD 我的答案:ABCD

21
HDFS只设置唯一一个名称节点带来的局限性包括
(2.0分)2.0 分
A、集群的可用性
B、
隔离问题
C、
命名空间的限制
D、
性能的瓶颈
正确答案: ABCD 我的答案:ABCD

1
CAP理论告诉我们,一个分布式系统一定可以同时满足一致性、可用性和分区容忍性这3个特性。
(1.0分)1.0 分
正确答案: × 我的答案: ×

不能同时满足

5
NoSQL是对各种新的可扩展、高性能数据库的简称,这类数据库保持了传统数据库支持ACID和SQL等特性。
(1.0分)1.0 分
正确答案: × 我的答案: ×

NewSQL是对各种新的可扩展、高性能数据库的简称,这类数据库保持了传统数据库支持ACID和SQL等特性

6
图数据库Neo4J完全兼容ACID。
(1.0分)1.0 分
正确答案: √ 我的答案: √

10
Hadoop Eclipse插件可以直接嵌入到Hadoop开发环境中,从而实现开发环境的图形界面化,降低编程的难度。
(1.0分)1.0 分
正确答案: √ 我的答案: √

19
HBase中,Region包含了位于某个值域区间内的所有数据,但它还不是负载均衡和数据分发的基本单位。
(1.0分)1.0 分
正确答案: × 我的答案: ×

HBase中,Region包含了位于某个值域区间内的所有数据,它是负载均衡和数据分发的基本单位。

2
类似于Hadoop MapReduce的通用并行框架是____。
(0.7分)0.7 分
正确答案
第一空:
spark

7
运行在YARN之上的下一代Hadoop查询处理框架是____。
(0.7分)0.7 分
正确答案
第一空:
tez

11
____是一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。
(0.7分)0.7 分
正确答案
第一空:
flume

12
____用于在Hadoop与传统数据库之间进行数据传递。
(0.7分)0.7 分
正确答案
第一空:
sqoop

8下列关于列族数据库的描述,哪一项是错误的?(2.0分)2.0 分
A、
查找速度慢,可扩展性差
B、
复杂性低
C、
容易进行分布式扩展
D、
功能较少,大都不支持强事务一致性
正确答案: A 我的答案:A

nosql数据库常常应用于Web2.0的场景中,对数据一致性的要求不是很高,而是强调高可用性,所以适当牺牲了一致性或分区容忍性
BASE表示:Basically Available、soft—state
、eventual consistency

11下列关于NoSQL与关系数据库的比较,哪个说法是错误的?(2.0分)2.0 分
A、
在扩展性方面,NoSQL 比较好
B、
在一致性方面,RDBMS强于NoSQL
C、
在可用性方面,NoSQL优于RDBMS
D、
在数据完整性方面,RDBMS容易实现
正确答案: C 我的答案:C

nosql可用性:很好
关系数据库:好
关系数据库在任何时候都以保证数据一致性为优先目标,其次才是优化系统性能,随着数据规模的增大,关系数据库为了保证严格的一致性只能提供相对较弱的可用性
大多数npsql都能提供较高的可用性

12
HBase只有一个针对行健的索引,如果要访问HBase表中的行,下面哪种方式是不可行的?
(2.0分)2.0 分
A、
通过时间戳访问
B、
通过一个行健的区间来访问
C、
全表扫描
D、
通过单个行健访问
正确答案: A 我的答案:A

13关于文档数据库的说法,下列哪一项是错误的?(2.0分)2.0 分
A、
数据是规则的
B、
复杂性低
C、
性能好(高并发)
D、
缺乏统一的查询语法
正确答案: A 我的答案:A

文档数据库:

  • 应用:存储、索引并管理面向文档的数据或是类似的半结构化的数据
  • 性能好、灵活性高、复杂性低、数据结构灵活
  • 缺点:缺乏统一的查询语句

15下列关于键值数据库的描述,哪一项是错误的?(2.0分)2.0 分
A、
条件查询效率高
B、
扩展性好,灵活性好
C、
无法存储结构化信息
D、
大量写操作时性能高
正确答案: A 我的答案:A

键值数据库

  • 典型应用:内容缓存
  • 优点:扩展性好,灵活性好,大量写操作时性能高
  • 缺点:无法存储结构化的信息,条件查询效率低

1NoSQL的三大基石?(3.0分)3.0 分
A、
最终一致性
B、
DN8
C、
BASE
D、
CAP
正确答案: ACD 我的答案:ACD

3
HBase的三层结构中,三层指的是哪三层?
(3.0分)3.0 分
A、
-ROOT-表
B、
数据类型
C、
Zookeeper文件
D、
META.表
正确答案: ACD 我的答案:ACD

4HBase访问接口类型包括哪些?(3.0分)3.0 分
A、
HBase Shell
B、
REST Gateway
C、
Thrift Gateway
D、
Native Java API
正确答案: ABCD 我的答案:ABCD

常用接口:

  • native java api
  • hbase shell
  • thrift gateway
  • rest gateway
  • pig
  • hive

5以下哪些软件可以对HBase进行性能监视?(3.0分)3.0 分
A、
OpenTSDB
B、
Ganglia
C、
Ambari
D、
Master-status(自带)
正确答案: ABCD 我的答案:ABCD

6
执行HBase读数据业务,需要读取哪几部分数据?
(3.0分)3.0 分
A、
HDFS
B、
HFile
C、
MemStore
D、
HLog
正确答案: BC 我的答案:BC

storeFile是磁盘中的文件,这些文件都是B树结构的,方便快速读取。在底层,StoreFile通过HDFS的HFile实现,Hfile的数据块通常采用压缩的方式存储,压缩之后可以大大减少网络I/O和磁盘I/O
当用户读取数据时,Region服务器会首先访问MemStore缓存如果数据不再缓存中,才会到磁盘上的StoreFile上去寻找

8
关系数据库已经流行很多年,并且Hadoop已经有了HDFS和MapReduce,为什么需要HBase?
(3.0分)3.0 分
A、
Hadoop可以很好地解决大规模数据的离线批量处理问题,但是,受限于Hadoop MapReduce编程框架的高延迟数据处理机制,使得Hadoop无法满足大规模数据实时处理应用的需求上
B、
HDFS面向批量访问模式,不是随机访问模式
C、
传统关系数据库在数据结构变化时一般需要停机维护;空列浪费存储空间
D、
传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题
正确答案: ABCD 我的答案:ABCD

9下列关于图数据库的描述,哪些是正确的?(3.0分)1.5 分
A、
灵活性高,支持复杂的图算法
B、
比较适合于社交网络、模式识别、依赖分析、推荐系统以及路径寻找等问题
C、
专门用于处理具有高度相互关联关系的数据
D、
复杂性高,只能支持一定的数据规模
正确答案: ABCD 我的答案:ABC

10下列关于文档数据库的描述,哪些是正确的?(3.0分)0.0 分
A、
文档数据库支持文档间的事务
B、
复杂性低,数据结构灵活
C、
具备统一的查询语法
D、
性能好(高并发),灵活性高
正确答案: BD 我的答案:ABD

文档数据库要用于存储并检索文档数据,党文档数据需要考虑很多关系和标准化约束,以及需要事物支持时,传统的关系数据库是更好的选择

11关于NoSQL的三大基石之一的CAP,下列哪些说法是正确的?(3.0分)3.0 分
A、
一个分布式系统可以同时满足一致性、可用性和分区容忍性这三个需求
B、
一致性,是指任何一个读操作总是能够读到之前完成的写操作的结果量
C、
可用性,是指快速获取数据
D、
分区容忍性,是指当出现网络分区的情况时(即系统中的一部分节点无法和其他节点进行通信),分离的系统也能够正常运行
正确答案: BCD 我的答案:BCD

12关系数据库引以为傲的两个关键特性(完善的事务机制和高效的查询机制),到了Web2.0时代却成了鸡肋,主要表现在以下哪几个方面?(3.0分)3.0 分
A、
Web2.0 网站系统通常不要求严格的数据库事务
B、
Web2.0 网站系统基本上不用关系数据库来存储数据
C、
Web2.0 并不要求严格的读写实时性
D、
Web2.0 通常不包含大量复杂的SQL 查询
正确答案: ACD 我的答案:ACD

13关系数据库已经无法满足Web2.0的需求,主要表现在以下几个方面?(3.0分)3.0 分
A、
使用难度高
B、
无法满足数据高并发的需求
C、
无法满足海量数据的管理需求
D、
无法满足高可扩展性和高可用性的需求
正确答案: BCD 我的答案:BCD
答案解析:

14HBase的实现包括哪三个主要的功能组件?(3.0分)3.0 分
A、
许多个Region服务器
B、
一个Master主服务器
C、
库函数:链接到每个客户端
D、
廉价的计算机集群
正确答案: ABC 我的答案:ABC
答案解析:

15
HBase与传统的关系数据库的区别主要体现在以下哪几个方面?
(3.0分)3.0 分
A、
数据维护
B、
数据类型
C、
数据操作
D、
存储模式
正确答案: ABCD 我的答案:ABCD

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值