调用MapReduce对文件中各个单词出现的次数进行统计。

本文档详述了如何在Ubuntu16.04操作系统上利用Hadoop3.1.3和Eclipse进行MapReduce实践。首先,将10000字英文单词文件上传至HDFS,然后在Eclipse中配置Hadoop插件,创建MapReduce项目,编写Java应用程序,打包并部署到Hadoop平台。最后,通过hadoop jar命令运行程序,检查output文件夹以验证单词计数结果。
摘要由CSDN通过智能技术生成

一、环境介绍

Ubuntu16.04操作系统

Hadoop3.1.3

Eclipse 编译器

二、数据来源及数据上传

准备一个待分析的文件(10000字英文单词文件,可从网上找英文文章),命名为ysh.txt。将文件放到/home/Hadoop文件下:

 

三、数据上传结果查看

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值