MapReduce单元测验
1单选(2分)
下列说法错误的是
2单选(2分)
在使用MapReduce程序WordCount进行词频统计时,对于文本行“hello hadoop hello world”,经过WordCount程序的Map函数处理后直接输出的中间结果,应该是下面哪种形式:
3单选(2分)
对于文本行“hello hadoop hello world”,经过WordCount的Reduce函数处理后的结果是
4多选(3分)
下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较正确的是
5多选(3分)
MapReduce体系结构主要由哪几个部分组成
6判断(2分)
MapReduce设计的一个理念就是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销。
7判断(2分)
两个键值对<“a”,1>和<“a”,1>,如果对其进行归并(merge),会得到<“a”,2>,如果对其进行合并(combine),会得到<“a”,<1,1>>
8填空(2分)
MapReduce采用____策略,一个存储在分布式文件系统中的大规模数据集,会被切分成许多独立的分片,这些分片可以被多个Map任务并行处理。
9填空(2分)
所谓___过程,是指对Map输出结果进行分区、排序、合并等处理,并交给Reduce的过程。