Idea+Maven运行简单的Hadoop WordCount程序

最新推荐文章于 2023-02-04 01:40:05 发布

幼稚调皮的钟

最新推荐文章于 2023-02-04 01:40:05 发布

阅读量2.9k

点赞数 1

分类专栏：大数据--Hadoop编程开发文章标签： hadoop wordcount 大数据

本文链接：https://blog.csdn.net/day_to_die/article/details/88691633

版权

本文介绍了如何在Manjora Linux上，利用Idea Ultimate 2018.3和Maven开发环境，创建并运行Hadoop的WordCount程序。重点包括项目的创建流程，如创建Maven项目、配置文件、设置运行参数，以及打包和测试过程。特别提示，项目需在Jdk 1.8环境下运行，并注意解决tools.jar的依赖问题。

摘要由CSDN通过智能技术生成

开发环境
操作系统：Manjora Linux
开发软件：Idea Ultimate 2018.3
Jdk开发环境：1.8（请尽量不要使用超过9以上的，如果环境不是1.8请修改pom.xml里面的toos.jar的版本）
Maven版本：maven3.3.9

文章目录

开发注意事项

项目代码

项目文件

1. 项目源代码

2. Maven配置文件

3. 执行的测试文件

4. 项目文件结构

项目创建流程

1. 创建一个Maven项目

2. 创建项目文件

3. 配置项目运行参数

4. 测试开发环境

5. 对项目进行打包

开发注意事项

尽量在Linux或MacOs操作系统上开发，Windows上有可能会出现权限问题
Jdk环境如果不是1.8的话请务必记得修改pom.xml里面tools.jar的版本号
idea只有Ultimate版本中才会自动集成这些插件，如果是社区版，操作会和本博客区别很大

项目代码

github-USCHadoop

项目文件

1. 项目源代码

WordCount.java

package cn.org.cerambycidae.Hadoop.WordCount;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.IOException;
import java.util.StringTokenizer;

public class WordCount {
   

    public static class TokenizerMapper
            extends Mapper<Object, Text, Text, IntWritable> {
   

        private final static IntWritable one = new IntWritable(1);
        private Text word = new Text();

        public void map(Object key, Text value, Context context
        ) throws IOException, InterruptedException {
   
            StringTokenizer itr = new StringTokenizer(value.toString());
            while (itr.hasMoreTokens()) {
   
                word.set(itr.nextToken());
                context

最低0.47元/天解锁文章

幼稚调皮的钟

关注

1
点赞
踩
26

收藏

觉得还不错? 一键收藏
10
评论
Idea+Maven运行简单的Hadoop WordCount程序

开发环境操作系统：Manjora Linux开发软件：Idea Ultimate 2018.3Jdk开发环境：1.8（请尽量不要使用超过9以上的，如果环境不是1.8请修改pom.xml里面的toos.jar的版本）Maven版本：maven3.3.9文章目录开发注意事项开发注意事项尽量在Linux或MacOs操作系统上开发，Windows上有可能会出现权限问题Jdk环境如果不...
复制链接

扫一扫

专栏目录