hadoop入门【6】java完成自定义的词频统计

最新推荐文章于 2022-04-13 14:53:57 发布

万和IT教育

最新推荐文章于 2022-04-13 14:53:57 发布

阅读量709

点赞数 1

分类专栏： hadoop入门文章标签： hadoop HDFS 词频统计分布式大数据

本文链接：https://blog.csdn.net/qq_41717874/article/details/90784267

版权

上一篇文章我们测试了hadoop自带的词频统计，本节将使用java完成自定义的词频统计。

1 系统、软件和前提约束

完成java访问HDFS服务
https://www.jianshu.com/p/386cd966c04f
测试了hadoop自定义的词频统计
https://www.jianshu.com/p/327d2af3903d

2 操作

1 在java访问HDFS的那个项目中，加入以下的测试类：

package net.wanho.mr;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WordCount {
    public static void ma

最低0.47元/天解锁文章

万和IT教育

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
hadoop入门【6】java完成自定义的词频统计

上一篇文章我们测试了hadoop自带的词频统计，本节将使用java完成自定义的词频统计。1 系统、软件和前提约束完成java访问HDFS服务https://www.jianshu.com/p/386cd966c04f 测试了hadoop自定义的词频统计https://www.jianshu.com/p/327d2af3903d2 操作1 在java访问HDFS的那个项目中，加入以下...
复制链接

扫一扫