【hadoop期末复习】第七章 MapReduce 超详细讲解

本文详述了Hadoop MapReduce的相关知识,包括MapReduce的框架结构、工作流程、核心函数Map与Reduce的职责,以及在WordCount案例中的应用。此外,还探讨了MapReduce与Hadoop的关系、适合MapReduce处理的任务特点、故障处理和数据传输优化策略。
摘要由CSDN通过智能技术生成

** 本专栏的Hadoop复习计划文章内容主要包含以下几个部分:

【简单】学习通习题

【进阶】课本课后练习

【操作】相关章节实验回顾

让我们开始吧!

学习通 - 习题

1. 下列说法错误的是

A.MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave
B.Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写
C.不同的Map任务之间不能互相通信
D.Map函数将输入的元素转换成<key,value>形式的键值对

我的答案:B

解析:

A.MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave - 正确

  1. Master:运行JobTracker
  2. Slave:运行TaskTracker 

B.Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写 - 错误

hadoop 可以通过 hadoop streaming 的方式调用其他编程语言实现 MapReduce,例如c++,Python等

C.不同的Map任务之间不能互相通信 - 正确

D.Map函数将输入的元素转换成<key,value>形式的键值对 - 正确


2. 在使用MapReduce程序WordCount进行词频统计时,对于文本行“hello hadoop hello world”,经过WordCount程序的Map函数处理后直接输出的中间结果,应该是下面哪种形式

A.<"hello",1>、<"hello",1>、<"hadoop",1>和<"world",1>
B.<"hello",2>、<"hadoop",1>和<"world",1>
C.<"hello",<1,1>>、<"hadoop",1>和<"world",1>
D.<"hello",1,1>、<"hadoop",1>和<"world",1>

我的答案:A

解析:

1)map之后的“中间结果”(只产生键值对)

<"hello",1>、<"hello",1>、<"hadoop",1>、<"world",1>

2)shuffle之后的结果(整合)

<"hello",<1,1>>、<"hadoop",1>和<"world",1>

3)reduce之后的结果(统计)

  • 19
    点赞
  • 128
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值