hadoop的wordcount的修改版

最新推荐文章于 2022-10-08 11:00:00 发布

VIP文章 Valar_Morghulis

最新推荐文章于 2022-10-08 11:00:00 发布

阅读量1k

点赞数 1

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/christprince007/article/details/38976585

版权

//这个是在原来的基础上修改以后得到的，将其中的分词的依据给换掉了，并且进行词频统计的时候会自动的忽略大小写

packageorg.apache.hadoop.mapred;

importjava.io.IOException;

importjava.util.ArrayList;

importjava.util.Iterator;

importjava.util.List;

importjava.util.StringTokenizer;

importorg.apache.hadoop.conf.Configuration;

import org.apache.hadoop.conf.Configured;

importorg.apache.hadoop.fs.Path;

importorg.apache.hadoop.io.IntWritable;

importorg.apache.hadoop.io.LongWritable;

importorg.apache.hadoop.io.Text;

importorg.apache.hadoop.mapred.FileInputFormat;

import org.apache.hadoop.mapred.FileOutputFormat;

importorg.apache.hadoop.mapred.JobClient;

importorg.apache.hadoop.mapred.JobConf;

importorg.apache.hadoop.mapred.MapReduceBase;

importorg.apache.hadoop.mapred.Mapper;

importorg.apache.hadoop.mapred.OutputCollector;

import org.apache.hadoop.mapred.Reducer;

importorg.apache.hadoop.mapred.Reporter;

importorg.apache.hadoop.util.Tool;

importorg.apache.hadoop.util.ToolRunner;

public classWordCount extends Configured implements Tool {

/*

这个类实现mapper接口的map方法，输入的是文本总的每一行。利用StringTokenizer将字符串拆分成单词。然后将输出结果(word, 1)写入到Outp

最低0.47元/天解锁文章

Valar_Morghulis

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
hadoop的wordcount的修改版

//这个是在原来的基础上修改以后得到的，将其中的分词的依据给换掉了，并且进行词频统计的时候会自动的忽略大小写 packageorg.apache.hadoop.mapred; importjava.io.IOException;importjava.util.ArrayList;importjava.util.Iterator;importjava.util.List;
复制链接

扫一扫

专栏目录

Valar_Morghulis

博客等级

码龄12年

76
原创

30
点赞

89
收藏

29
粉丝

关注

私信

热门文章

分类专栏

数据结构 9篇
linux 18篇
数据挖掘 7篇
Hadoop 9篇
JAVA 10篇
Shell 4篇
并行计算 10篇
CronTab 3篇
Machine_learning 2篇

最新评论

利用vector进行求和
gz7seven: vector可以用accumulate函数求和
Hadoop伪分布模式配置部署
Jane_1103: 大佬你出现过这个问题吗SHUTDOWN_MSG: Shutting down NameNode at master/192.168.32.4 还有你用的是内网还是公网？
每天一点儿java---继承exception类来实现自己的异常类
白开水不加糖xy: 请问，自定义异常类extends Exception 中的构造方法怎么快捷生成，Idea
OpenMp之快速排序
诚哥在天之灵: 确实能用，只是老哥不讲解一下么
改进后的向量空间模型（VSM）
bo_hai: 没有看明白如何进行了改进？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。