单选题
请认真阅读每道题目,并按题目要求进行作答。
1.大数据方向单选题一般5分
得分5分
以下关于Flume,说法错误的是( )
A: Flume 以agent 为最小的独立运行单位,一个agent 就是一个JVM。
单agent 由Source、Sink 和Channel 三大组件构成
B: Flume 的数据流由事件(Event)贯穿始终,事件是Flume 的基本
数据单位
C: Flume 三种级别得可靠性保障,从强到弱依次为:end-to-end、
- 4 -
Store on failure、Besteffort
D: Channel 中filechannel 可将数据持久化到本地磁盘,但配置较为
麻烦,需要配置数据目录和checkpoint 目录,不同的file channel
可以配置同一个checkpoint 目录
考生答案:D
正确答案:D
2.大数据方向单选题一般5分
得分5分
查看kafka 某topic 的partition 详细信息时
,使用如下哪个命令( )
A: bin/kafka-topics.sh –create
B: bin/kafka-topics.sh –list
C: bin/kafka-topics.sh –describe
D: bin/kafka-topics.sh -delete
考生答案:C
正确答案:C
3.大数据方向单选题一般5分
得分5分
HIVE 中表的默认存储格式为( )
A: TextFile
B: Avro
C: SequenceFile
D: RCFile
考生答案:A
正确答案:A
4.大数据方向单选题一般5分
得分5分
HDFS 中的block 默认保存几份( )
A: 1
B: 2
C: 3
D: none of the above
考生答案:C
正确答案:C
5.大数据方向单选题一般5分
得分5分
下面哪个进程负责HDFS 数据存储( )
A: NameNode
B: JobTracker
C: DataNode
D: SecondaryNameNode
考生答案:C
正确答案:C
6.大数据方向单选题一般5分
得分5分
HBase 依靠( )存储底层数据
A: HDFS
B: memory
C: mapreduce
D: hadoop
考生答案:A
正确答案:A
7.大数据方向单选题一般5分
得分5分
下面哪条命令可以把f1.txt 复制为f2.txt?( )
A: cp f1.txt | f2.txt
B: cat f1.txt | f2.txt
C: cat f1.txt > f2.txt
D: copy f1.txt | f2.txt
考生答案:C
正确答案:C
8.大数据方向单选题一般5分
得分5分
怎样更改一个文件的权限设置( )
A: attrib
B: chmod
C: change
D: file
考生答案:B
正确答案:B
9.大数据方向单选题一般5分
得分5分
下列哪些选项可以查看hdfs 文件系统指定目录下文件的命令( )
A: hadoop -ls /home
B: hadoop -fs -ls /home
C: hadoop -fs ls /home
D: hadoop fs -ls /home
考生答案:D
正确答案:D
10.大数据方向单选题一般5分
得分5分
如果有多个Kafka 程序同时消费一个topic,如何保证取到不同的事件( )
A: 使用相同的client.id
B: 使用相同的group.id
C: 使用相同的zookeeper
D: 使用相同的bootstrap-server
考生答案:B
正确答案:B
11.大数据方向单选题一般5分
得分5分
大表1000 万条数据,小表1000 条数据,为提高查询效率两行表关联时通常做法是( )
A: 大表在前
B: 大表在后
C: 小表子查询
D: 先处理成一张表再查询
考生答案:B
正确答案:B
12.大数据方向单选题一般5分
得分5分
HDFS 的设计中没有考虑以下哪个特性( )
A: 超大文件
B: 流式的数据访问
C: 高吞吐
D: 低数据延迟
考生答案:D
正确答案:D
多选题
请认真阅读每道题目,并按题目要求进行作答。
13.大数据方向多选题一般7分
得分0分
下列对数据库事务的描述正确的是( )
A: 一致性
B: 独立性
C: 持久性
D: 原子性
考生答案:A,B,C,D
正确答案:A,C,D
14.大数据方向多选题一般7分
得分7分
下面哪个不负责HDFS 的数据存储( )
A: DataNode
B: NameNode
C: secondNameNode
D: DfsClient
考生答案:B,C,D
正确答案:B,C,D
15.大数据方向多选题一般7分
得分0分
在SQL 中以下哪些方式可以用来对数据排序( )
A: ORDER BY
B: ROW_NUMBER( ) OVER( )
C: PARTITION BY
D: RANK( ) OVER( )
考生答案:A
正确答案:A,B,D
判断题
请认真阅读每道题目,并按题目要求进行作答。
16.大数据方向判断题一般9分
得分9分
Hadoop 默认调度器策略为FIFO( )
A: 正确
B: 错误
考生答案:B
正确答案:B
17.大数据方向判断题一般10分
得分0分
kafka 的数据是存储在内存中的( )
A: 正确
B: 错误
考生答案:B
正确答案:A