MapReduce基础练习

1.以下关于Shuffle过程的说法,错误的是:(B   )

A.从Map任务结束到Reduce阶段开始的过程称为Shuffle阶段

B.从Map任务的开始到Reduce阶段开始的过程称为Shuffle阶段

C.对Map输出进行进行分区过程,默认采用的是哈希函数

D.对Map输出进行排序是默认的操作

 

2.以下关于MapReduce程序的工作过程,正确的有:(B   )

A.不同的Map任务之间会进行通信

B.不同的Reduce任务之间也不会发生任何信息交换

C.不同的Reduce任务之间会发生信息交换

D.Map和Reduce之间也不会发生任何数据交换

 

3.假设要对以下文件中每个单词及其出现次数(频数),并按照单词字母顺序排序,每个单词和其频数占一行,单词和频数之间有间隔。

输入:

Hello World

Hello Hadoop

Hello MapReduce

以下说法中,错误的是:(  B  )

A.其中的一个Map输出为 <MapReduce,1>

B.其中的一个Reduce输入为<Hello,1>

C.其中一个Reduce输出为<World 1>

D.其中的一个Map输入为<0,Hello World>   注:这里的0是行偏移量

 

4.以下关于Hadoop的说法正确的有:(D    )

A.HDFS负责分布式数据处理

B.HDFS负责分布式数据存储

C.MapReduce负责分布式数据存储

D.MapReduce负责分布式数据处理

 

5.MapReduce程序执行的阶段主要有:ABCD

A.Map

B.Reduce

C.Split

D.Shuffle

 

6.下列成员属于MapReduce体系结构中的有:BC

A.NameNode

B.JobTracker

C.TaskTracker

D.DataNode

 

7.关于MapReduce过程中的split阶段,说法正确的是:( AC  )

A.split 的多少决定了Map任务的数目

B.split 的多少决定了Reduce任务的数目

C.理想的split大小与HDFS块一样大

D.split大小不可以人为的设定

 

8.关于MapReduce程序,下列说法正确的有:BD

A.MapReduce程序是从Map类处开始运行

B.MapReduce程序主要包含Map、Reduce、主函数三部分

C.Map函数与Reduce函数在程序运行过程中只执行一次

D.Map函数与Reduce函数在程序运行过程中会执行多次

 

9.MapReduce设计的一个理念就是“数据向计算靠拢”,而不是“计算向数据靠拢”。B

A. 对

B. 错

 

10.两个键值对<“a”,1>和<“a”,1>,如果合并,会得到<“a”,2>,如果归并,会得到<“a”,<1,1>> 。A

A. 对

B. 错

 

 

 

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值