命令行中实现mapreduce经典入门程序wordcount，输入输出均为hdfs

最新推荐文章于 2024-01-08 17:41:09 发布

Late whale

最新推荐文章于 2024-01-08 17:41:09 发布

阅读量1.1k

点赞数 2

分类专栏： big data 文章标签： mapreduce wordcount教程 mapreduce 入门教程wordcount程序用mapreduce 实现wordcount程序 mapreduce 入门wordcount程序用hdsf文件作输入输出 mapreduce中实现wordcount教程

本文链接：https://blog.csdn.net/Late_whale/article/details/103466936

版权

在Hadoop环境中，使用Java SDK编写并执行WordCount程序，包括创建Mapper、Reducer及主类，将文本数据上传至HDFS，编译Java源码，生成jar包并运行。通过HDFS命令查看结果，完成数据统计。运行完成后记得清理output目录。

摘要由CSDN通过智能技术生成

实验环境：hadoop+java jdk+ubuntu

准备数据文件
新建一个叫test的文本文件
pass:gedit 是一款文本编辑器，非常好用，没有的可以改为vi或vim
在这里插入图片描述

内容随便输

a b d aaa
das fs aa
ddd fssf
fsa aa
www werf
faa

在这里插入图片描述
编写代码

同样的，新建一个WordCountMapper.java,WordCountReducer.java,WordCount.java
在这里插入图片描述
并将以下代码复制进去

WordCountMapper.java

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import java.io.IOException;
import java.util.StringTokenizer;

public class WordCountMapper extends Mapper<LongWritable,Text,Text,IntWritable>{
   
    @Override
    protected void map(LongWritable key, Text value, Context context)
            throws IOException, InterruptedException {
   
        //得到输入的每一行数据
        String line=value.toString();

        StringTokenizer st=new StringTokenizer(line);
        while (st.hasMoreTokens()){
   
            String word= st.

最低0.47元/天解锁文章

Late whale

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
命令行中实现mapreduce经典入门程序wordcount，输入输出均为hdfs

实验环境：hadoop+java jdk+ubuntu准备数据文件新建一个叫test的文本文件pass:gedit 是一款文本编辑器，非常好用，没有的可以改为vi或vim内容随便输a b d aaadas fs aaddd fssffsa aawww werffaa编写代码同样的，新建一个WordCountMapper.java,WordCountReducer.ja...
复制链接

扫一扫

专栏目录