Hadoop实践（三）---MR作业运行（源码详解）

最新推荐文章于 2021-05-23 19:14:28 发布

狮锅艺

最新推荐文章于 2021-05-23 19:14:28 发布

阅读量2k

点赞数

分类专栏： Hadoop MapReduce Hadoop实践文章标签： hadoop mapreduce 源码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Wee_Mita/article/details/72723527

版权

要运行MapReduce作业首先要编写MR程序。
MR程序主要包括三个部分：Map类，Reduce类和驱动类。

定义一个反向索引的例子，首先需要定义map类，reduce类需要将输入数据中的每个单词单独显示一行，那么map 的输出key应该是输入文件中的每个单词，然后MR将这些key合并到一起，每个key 的值将包含文件名

map类代码：

 public static class Map extends Mapper<LongWritable, Text, Text, Text> {        
//在扩展MR的mapper类时，需要确定输入和和输出的键值的数据类型。在作业中使用MR默认的InputFormat，该类将输入文件中的字节偏移量作为键，将每一行的数据作为值

        private Text documentId;  //输入以文本对象的形式存储文件名
        private Text word = new Text();  //为了减少对象的创建，需要创建一个可以复用的单一的文本对象

        @override
        protected void setup(Context context){  //上下文中提取文件名
        //setup方法在map方法调用之前执行，使用这个机会存储map中的输入文件名
            String filename = ((FileSplit)context.getInputSplit()).getPath().getName();
            documentId = new Text(filename);
            }

        public

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
Hadoop实践（三）---MR作业运行（源码详解）

源码解析MapReduce作业处理过程
复制链接

扫一扫

专栏目录

狮锅艺 CSDN认证博客专家 CSDN认证企业博客

码龄9年

185: 原创

7万+: 周排名

93万+: 总排名

29万+: 访问

: 等级

4732: 积分

85: 粉丝

54: 获赞

9: 评论

122: 收藏

私信

关注

热门文章

分类专栏

Golang 1篇
感悟 1篇
基础算法（Java） 27篇
Spark原理 8篇
Java实践 33篇
Hadoop实践 29篇
Maven实践 12篇
Shell编程 5篇
深入理解计算机系统 1篇
Linux 30篇
Java 59篇
Spark 8篇
Maven 15篇
Hadoop 46篇
MapReduce 23篇
Mahout 6篇
HDFS 13篇
Ambari 5篇
ZooKeeper 1篇
Windows 6篇
vSphere 5篇
Office 9篇
数据结构与算法分析 28篇
源代码 15篇
GitHub 1篇
图计算 1篇
计算机系统 1篇

最新评论

Hadoop实践（三）---MR作业运行（源码详解）
No Kill Leader: 哈哈
Hadoop实践（三）---MR作业运行（源码详解）
侠客刀: 这叫源码解析，，，
Linux下识别NTFS格式的U盘
程序员部落Pro: 谢谢博主，学习了
基础算法（零）---递归
狮锅艺回复 Mr.隐者: [code=java] package T616; import java.util.Scanner; /** * Created by Promacanthus on 2017/6/16. */ public class fibonacci { private static int k = 0; private long n; fibonacci(long n) { System.out.println(calfibonacci(n)); } private long calfibonacci(long n) { if (n == 0 || n == 1) { k++; return n; } else { return calfibonacci(n - 1) + calfibonacci(n - 2); } } public static void main(String[] args) { Scanner scanner = new Scanner(System.in); long n = scanner.nextLong(); new fibonacci(n); System.out.println("Total call " + k + " times"); } } [/code]
基础算法（零）---递归
Mr.隐者: 打不开代码栏

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。