JAVA-API 简单实现MapReduce统计单词

最新推荐文章于 2022-11-01 10:08:59 发布

忧伤的橘子

最新推荐文章于 2022-11-01 10:08:59 发布

阅读量632

点赞数

分类专栏： linux Hadoop MapReduce

本文链接：https://blog.csdn.net/qq_45255036/article/details/103795308

版权

(一) JAVA-API 简单实现MapReduce统计单词

()这是要处理的文件

在这里插入图片描述

1.导入maven依赖

		<dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>2.8.1</version>
        </dependency>

2.创建Mapper类继承类 org.apache.hadoop.mapreduce.Mapper

package org.zsw.hadoop;

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

/**
 * @description:
 * @author: zsw
 * @date: Created in 2019/12/31 20:30
 * @version: 1
 * @modified By:
 */
public class WordCountMap extends Mapper<LongWritable, Text,Text, LongWritable> {
   

//    由于map方法的调用频率是按行调用，所以其参数表示的意义基本和行相关
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
   
//        key一般来说都是LongWritable类型，表示当前行的起始偏移量，从0开始
//        value 值得是这一行具体内容
//        context指的是上下文对象，上承接框架底层输入,下启shuffle阶段的输入(通常会说作为reduce阶段的输入)。
        String line = value.toString();
        String[] vals = line.split(" ");
        for (String val : vals) {
   
            context.write(new Text(val

最低0.47元/天解锁文章

忧伤的橘子

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
JAVA-API 简单实现MapReduce统计单词

(一) JAVA-API 简单实现MapReduce统计单词()这是要处理的文件1.导入maven依赖 <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId&...
复制链接

扫一扫