mapreduce词频统计

最新推荐文章于 2024-10-14 22:15:56 发布

qq_53169545

最新推荐文章于 2024-10-14 22:15:56 发布

阅读量712

点赞数 1

文章标签： mapreduce 大数据数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_53169545/article/details/131343659

版权

一、环境准备

搭建mapreduce开发环境

（1）分别配置mapred-site.xml、yarn-site.xml和slaves文件，并分发给slave1,slave2,之前配过文件，就不在这详细说明了。

（2）初始化

（3）start

(4)8088端口页面

二、实验分析

开发mapreduce程序（Map,reduce和driver）,统计wordcount.txt文件中的单词的数量。

三、实验实现与结果

（1）实现代码

package org.example;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import java.io.IOException;
import java.util.StringTokenizer;
public class WordCount {
    /**
     * 静态内容部类
     * 规定 map 中用到的数据类型，这里的 Text 相当于 jdk 中的 String IntWritable 相当于 jdk 的 int 类型，* 这样做的原因主要是为了 hadoop 的数据序化而做的。
     */

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

qq_53169545 CSDN认证博客专家 CSDN认证企业博客

码龄4年

10: 原创

132万+: 周排名

31万+: 总排名

5392: 访问

: 等级

103: 积分

3: 粉丝

3: 获赞

4: 评论

33: 收藏

私信

关注

热门文章

最新评论

mapreduce词频统计
CSDN-Ada助手: 恭喜您写了第10篇博客！您的博客内容一直很优秀，这篇“mapreduce词频统计”也非常实用。建议您可以尝试探索一些更深入的主题，例如mapreduce在大数据处理中的应用，或者在词频统计中使用不同的算法等。期待您的新作品！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
Hadoop基础环境搭建
CSDN-Ada助手: 恭喜您成功发表了第一篇博客！Hadoop基础环境搭建确实是一个非常重要的话题，很多读者都会从您的博客中受益。接下来，建议您可以继续分享一些实战经验和技巧，让读者更加深入地了解Hadoop的应用。希望您能够坚持写作，为大家带来更多有价值的内容。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
Android Studio项目创建、部署及调试
CSDN-Ada助手: 非常感谢你分享这篇关于Android Studio项目创建、部署及调试的博客。看到你详细的步骤描述，我相信很多刚开始学习Android开发的人都会受益匪浅。除了你提到的任务，我想提醒一下，学会使用版本控制工具Git，能够更好地管理自己的代码和协作开发。另外，学习如何使用Gradle构建项目，可以更好地管理项目中的依赖关系和构建过程。希望你能继续分享你的学习和经验，我们一起进步。如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
Spark SQL 综合应用
CSDN-Ada助手: 恭喜您写出了这样一篇综合应用的Spark SQL博客！您的文章内容详实、观点独到，让人受益匪浅。接下来，我建议您可以深入研究Spark SQL在实际项目中的应用，分享更多实践经验，让更多读者受益。期待您的下一篇好文！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
在hadoop集群DataNode动态服役、下线节点
CSDN-Ada助手: 非常感谢您分享这篇关于hadoop集群DataNode的博客，您的经验和观点对我们这些初学者来说非常有价值。恭喜您已经写了第5篇博客，这是一个值得庆祝的里程碑。接下来，我希望您可以继续分享关于hadoop集群的使用技巧和心得，比如如何优化性能，处理异常情况等等。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。