hadoop 运行java程序_hadoop上运行java程序（zz）

最新推荐文章于 2022-05-23 19:02:30 发布

ExShepherd

最新推荐文章于 2022-05-23 19:02:30 发布

阅读量149

点赞数

文章标签： hadoop 运行java程序

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_34348050/article/details/114101552

版权

hadoop上运行java程序(zz)

(2011-04-19 15:31:49)

标签：

杂谈

建立WordCount.java文件

package org.myorg;

import java.io.IOException;

import java.util.*;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.conf.*;

import org.apache.hadoop.io.*;

import org.apache.hadoop.mapred.*;

import org.apache.hadoop.util.*;

public class WordCount {

public static class Map extends MapReduceBase implements

Mapper

IntWritable> {

private final static IntWritable one = new IntWritable(1);

private Text word = new Text();

public void map(LongWritable key, Text value,

OutputCollector

output, Reporter reporter) throws IOException {

String line = value.toString();

StringTokenizer tokenizer = new StringTokenizer(line);

while (tokenizer.hasMoreTokens()) {

word.set(tokenizer.nextToken());

output.collect(word, one);

}

}

}

public static class Reduce extends MapReduceBase implements

Reducer

IntWritable> {

public void reduce(Text key,

Iterator values,

OutputCollector

output, Reporter reporter) throws IOException {

int sum = 0;

while (values.hasNext()) {

sum += values.next().get();

}

output.collect(key, new IntWritable(sum));

}

}

public static void main(String[] args) throws Exception {

JobConf conf = new JobConf(WordCount.class);

conf.setJobName("wordcount");

conf.setOutputKeyClass(Text.class);

conf.setOutputValueClass(IntWritable.class);

conf.setMapperClass(Map.class);

conf.setCombinerClass(Reduce.class);

conf.setReducerClass(Reduce.class);

conf.setInputFormat(TextInputFormat.class);

conf.setOutputFormat(TextOutputFormat.class);

FileInputFormat.setInputPaths(conf, new Path(args[0]));

FileOutputFormat.setOutputPath(conf, new Path(args[1]));

JobClient.runJob(conf);

}

}

然后编译WordCount.java文件，把它制作成可执行jar包

javac -d . -classpath /root/hadoop-0.20.1/hadoop-0.20.1-core.jar

WordCount.java

然后在org的同级目录上建立manifest.mf

在里面写上Main-Class: org.myorg.WordCount

然后保存并执行jar -cvfm count.jar manifest.mf org/

然后在hdfs上建立一个文件夹，hadoop fs -mkdir /test

hadoop fs -put /root/wordtestnum.txt /test

然后执行hadoop jar /root/Desktop/count.jar /test/in /test/out

查看运行结果hadoop fs -cat /test/out/part-00000

分享：

喜欢

0

赠金笔

加载中，请稍候......

评论加载中，请稍候...

发评论

登录名：密码：找回密码注册记住登录状态

昵称：

评论并转载此博文

发评论

以上网友发言只代表其个人观点，不代表新浪网的观点或立场。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop 运行java程序_hadoop上运行java程序（zz）

hadoop上运行java程序(zz)(2011-04-19 15:31:49)标签：杂谈建立WordCount.java文件package org.myorg;import java.io.IOException;import java.util.*;import org.apache.hadoop.fs.Path;import org.apache.hadoop.conf.*;import o...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。