以下答案仅供参考,如有错误欢迎指正~
-
单选(2分)以下关于日志采集工具Flume的说法不正确的是:
A.Flume适用于大量数据的实时数据采集
B.Flume的数据源和目标都是可定制、可扩展的
C.Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输的日志收集系统
D.Flume支持多级级联和多路复制
-
单选(2分)以下关于数据分发中间件Kafka的说法不正确的是:
A.每条发布到Kafka集群的消息都属于一个主题(topic)
B.Kafka是一个基于发布/订阅的消息系统
C.Kafka将Topic分成一个或者多个Partition
D.Kafka主要是使用c++、Java语言实现的
-
单选(2分)以下关于分布式文件系统HDFS的说法不正确的是:
A.HDFS支持存储TB-PB级别的数据
B.数据块(Block)是HDFS文件系统基本的存储单位
C.HDFS支持多用户写入,任意修改文件
D.HDFS是能够运行在通用硬件上的分布式文件系统
-
单选(2分)HDFS集群中管理文件系统的元数据、负责客户端请求响应的节点是:
A.DataNode
B.NameNode
C.ClientNode
D.ActiveNode
-
单选(2分)HDFS(Hadoop 1.X版本中)默认的块大小是:
A.32 MB
B.64 KB
C.64 MB
D.32 KB
-
单选(2分)以下关于分布式数据库HBase的说法不正确的是:
A.HBase比传统关系数据库系统具有更加丰富的数据类型
B.HBase源于Google BigTable技术
C.HBase是一个基于列式存储的分布式数据库系统
D.HBase不支持复杂的SQL操作,例如表连接
-
单选(2分)HBase中分布式存储和负载均衡的最小单元是:
A.Block
B.Region
C.Partition
D.Table
-
单选(2分)以下关于数据仓库Hive的说法不正确的是:
A.Hive将用户的查询语句转换为MapReduce作业提交到Hadoop集群上执行
B.Hive的数据最终都保存为HDFS文件
C.Hive能够在大规模数据集上实现低延迟快速的查询
D.Hive主要是为分析数据而设计的数据仓库
-
多选(2分) Hive的数据模型主要包括:
A.桶(Buckets)
B.块(Blocks)
C.分区(Partitions)
D.表(Tables)
-
多选(2分)NoSQL数据库的主要类型包括:
A.文档数据库
B.列族数据库
C.键值数据库
D.图形数据库