1.以下关于Shuffle过程的说法,错误的是:(B )
A.从Map任务结束到Reduce阶段开始的过程称为Shuffle阶段
B.从Map任务的开始到Reduce阶段开始的过程称为Shuffle阶段
C.对Map输出进行进行分区过程,默认采用的是哈希函数
D.对Map输出进行排序是默认的操作
2.以下关于MapReduce程序的工作过程,正确的有:(B )
A.不同的Map任务之间会进行通信
B.不同的Reduce任务之间也不会发生任何信息交换
C.不同的Reduce任务之间会发生信息交换
D.Map和Reduce之间也不会发生任何数据交换
3.假设要对以下文件中每个单词及其出现次数(频数),并按照单词字母顺序排序,每个单词和其频数占一行,单词和频数之间有间隔。
输入:
Hello World
Hello Hadoop
Hello MapReduce
以下说法中,错误的是:( B )
A.其中的一个Map输出为 <MapReduce,1>
B.其中的一个Reduce输入为<Hello,1>
C.其中一个Reduce输出为<World 1>
D.其中的一个Map输入为<0,Hello World> 注:这里的0是行偏移量
4.以下关于Hadoop的说法正确的有:(D )
A.HDFS负责分布式数据处理
B.HDFS负责分布式数据存储
C.MapReduce负责分布式数据存储
D.MapReduce负责分布式数据处理
5.MapReduce程序执行的阶段主要有:ABCD
A.Map
B.Reduce
C.Split
D.Shuffle
6.下列成员属于MapReduce体系结构中的有:BC
A.NameNode
B.JobTracker
C.TaskTracker
D.DataNode
7.关于MapReduce过程中的split阶段,说法正确的是:( AC )
A.split 的多少决定了Map任务的数目
B.split 的多少决定了Reduce任务的数目
C.理想的split大小与HDFS块一样大
D.split大小不可以人为的设定
8.关于MapReduce程序,下列说法正确的有:BD
A.MapReduce程序是从Map类处开始运行
B.MapReduce程序主要包含Map、Reduce、主函数三部分
C.Map函数与Reduce函数在程序运行过程中只执行一次
D.Map函数与Reduce函数在程序运行过程中会执行多次
9.MapReduce设计的一个理念就是“数据向计算靠拢”,而不是“计算向数据靠拢”。B
A. 对
B. 错
10.两个键值对<“a”,1>和<“a”,1>,如果合并,会得到<“a”,2>,如果归并,会得到<“a”,<1,1>> 。A
A. 对
B. 错