通过编程实现词频统计并导出jar在终端运行
创建词文件夹
mkdir wordcount
进入文件夹
创建两个词文档
vim word1.txt
vim word2.txt
打开eclipse编写程序
1.导入需要的jar
导入此路径下所有jar(下同)
2.创建package
3.创建class
编写代码
代码如下:
package wordcount1;
import java.io.IOException;
import java.util.Iterator;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;