Hadoop自带的wordcount统计太香了

最新推荐文章于 2024-04-19 23:59:11 发布

光数葱丁

最新推荐文章于 2024-04-19 23:59:11 发布

阅读量436

点赞数

分类专栏： hadoop

本文链接：https://blog.csdn.net/weixin_44328257/article/details/126404578

版权

hadoop 大数据 mapreduce

hadoop 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

如果说用Hadoop自带的词频统计，那是不是很惊喜，很意外？

在Hadoop官方提供的示例包中，就是统计词频的模块，可以拿来直接使用，因此直接调用。实例如下：

hadoop jar \
$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar \
wordcount \
/home/test/SqlDataSourcr.txt \
/home/teat/

第2行：指的是主机中的环境变量；

第2行：官方提供的程序包；

第3行：程序包中的主类名称；

第4行：HDFS上的文件以目录和文件；

第5行：统计好后要输出的目录；

运行上面的命令，过程很长，显示如下：

程序先执行map任务

map完了执行reduce任务。

最后完毕：

使用-cat命令查看统计后的效果：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

光数葱丁

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Hadoop2.7运行自带的wordcount

l1394049664的博客

09-09

2870

目录 1、准备数据文件 2、把文件上传到HDFS上 3、执行命令 4、原理解析 1、准备数据文件 word1.txt i love the world word2.txt i love the world , hello ni hao 2、把文件上传到HDFS上 hadoop fs -mkdir /input hadoop fs -put word1.txt /input ...

Hadoop自带WordCount进行词频统计（mapreduce）

weixin_43322782的博客

12-10

8407

Hadoop自带WordCount进行词频统计准备：安装好的Hadoop 需要统计词频txt文件 step1 启动Hadoop cd /usr/local/hadoop ./sbin/start-all.sh 用jps命令查看是否开启成功准备好需要统计词频的txt文件（也可以用filezilla传入Ubuntu）链接: 如何用filezilla连接Ubuntu. 找到Hadoop文件所在位置把需要计算词频的文件放在Hadoop文件下 step2 使用Hadoo

参与评论您还未登录，请先登录后发表或查看评论

hadoop自带示例wordcount

热门推荐

侠客小虎的博客

01-17

2万+

1.首先确认你的hadoop启动了。 master与slave启动方式相同，进入hadoop目录下的sbin目录，命令:$cd /home/hadoop/hadoop/sbin (根据个人安装的hadoop目录调整) 启动hadoop：(1)$./start-dfs.sh (2)$./start-yarn.sh 启动后的效果如图：master如图1，slave如图2 图1 图2

hadoop自带的wordcount

姚锦叙|java|solr|hadoop|hbase

11-24

190

1、通过hadoop的命令在HDFS上创建/tmp/workcount目录，命令如下：bin/hadoop fs -mkdir /tmp/wordcount 2、通过copyFromLocal命令把本地的word.txt复制到HDFS上，命令如下：bin/hadoop fs -copyFromLocal /home/grid/word.txt /tmp/wordcount/word.tx...

[Hadoop]运行自带wordcount程序

weixin_44566432的博客

04-22

1394

话不多说。 1、开启Hadoop服务首先到Hadoop安装目录下的/sbin，然后运行./start-all.sh 当看到上面六个服务说明已经正常启动了，那么继续下一步 2、回到Hadoop安装目录下，执行下面命令创建文件夹及文件 bin/hadoop fs -mkdir -p /test/wordcount #创建一个test/wordcount文件目录 ...

Hadoop2.5.1测试（运行自带的wordcount）

u012859691的专栏

03-20

845

一、准备工作启动hadoop（如有疑问见上篇博文），jps查看进程：hadoop@h1:~$ jps 3395 SecondaryNameNode 5222 Jps 3177 NameNode 4394 JobHistoryServer 3565 ResourceManager二、进行测试1、建立输入文件：echo "My first hadoop example. Hello Hadoop in

使用hadoop实现WordCount实验报告.docx

06-10

3. **运行WordCount程序**：调用Hadoop自带的Java程序`hadoop-mapreduce-examples-2.7.7.jar`，指定输入和输出参数。 ### 四、实验结果成功运行WordCount后，可以在指定的输出文件夹（例如/output）中看到统计...

大数据：Hadoop入门案例，命令行wordcount统计(1)

2401_84123171的博客

04-19

897

学完之后，若是想验收效果如何，其实最好的方法就是可自己去总结一下。比如我就会在学习完一个东西之后自己去手绘一份xmind文件的知识梳理大纲脑图，这样也可方便后续的复习，且都是自己的理解，相信随便瞟几眼就能迅速过完整个知识，脑补回来。下方即为我手绘的Android框架体系架构知识脑图，由于是xmind文件，不好上传，所以小编将其以图片形式导出来传在此处，细节方面不是特别清晰。但可给感兴趣的朋友提供完整的Android框架体系架构知识脑图原件（包括上方的面试解析xmind文档）

hadoop的wordcount实例代码

08-28

Hadoop的WordCount实例代码是Hadoop MapReduce编程模型的经典示例，通过对大文件中的单词出现次数的统计，展示了MapReduce编程模型的基本思想和实现细节。 Hadoop MapReduce编程模型 Hadoop MapReduce编程模型是...

大数据：Hadoop入门案例，命令行wordcount统计

最新发布

2401_84123188的博客

04-19

1060

以Hadoop自带的wordcount为例，说明如何在Windows环境下，统计若干文件中的单词出现次数。上传要统计的文件。假设在计算机本地有三个文件，f1.txt，f2.txt，f3.txt，这个三个文件位于E:/myfile文件夹下，需要把myfile整个文件上传到HDFS上。本例目的就是统计存放到HDFS中的f1,f2,f3这三个文件中的单词个数。1、需要现在HDFS上创建一个文件夹，假设这个文件夹名字为test_dir。

Hadoop的WordCount实例代码

01-14

关于Hadoop的WordCount实例代码，能够实现实现单词计数。

【MapReduce】Hadoop 自带示例wordcount 运行

Mr_zhuo_的博客

10-24

1281

上一节中成功安装了Hadoop，下面简单应用：Hadoop自带示例wordcount的运行。 1. 开启Hadoop cd /usr/local/Cellar/hadoop/3.2.1 sbin/start-dfs.sh 【警告】2019-10-23 22:06:17,626 WARN util.NativeCodeLoader: Unable to load native-hado...

手把手教你使用Hadoop自带的wordcount程序

qq_43008103的博客

07-13

5343

切换到hadoop用户，启动Hadoop su hadoop start-all.sh mr-jobhistory-daemon.sh start historyserver

运行hadoop自带的案例—wordcount

weixin_44310899的博客

05-21

782

主要有四个步骤：一、在hdfs分布式文件系统中创建两个文件夹，分别存放输入、输出数据 1、 bin/hadoop fs –mkdir –p/data/wordcount 创建的输入数据目录 2、 bin/hadoop fs –mkdir –p/output/ 创建的输出数据目录二、将要测试的文件上传到hdfs文件系统的输入数据目录 1...

分析Hadoop自带WordCount例子的执行过程

真的想做点事情

06-07

2437

在Hadoop的发行包中也附带了例子的源代码，WordCount.java类的主函数实现如下所示：Java代码 public static void main(String[] args) throws Exception { int res = ToolRunner.run(new Configu

Hadoop自带wordcount实例

weixin_41827712的博客

10-28

1381

Hadoop自带wordcount实例 Hadoop环境搭建成功后，运行一下wordcount实例 1、终端切换到root：su- 2、启动HDFS，如果是第一次用的话，先格式化namenode： hdfs namenode -format(格式化一次就行，总格式化会导致集群id不一致，会报错，不要问我咋知道的????) 3、在HDFS创建目录：/data/wordcount存放本地上传的文件，/output目录存放MapReduce任务的结果输出文件。 4、在本地建一个文件，输入点单词，然后查看一下，

Hadoop系列－－Hadoop自带程序wordcount运行示例

高自强的博客

08-11

1695

1 准备工作　　先启动Hadoop。 1.格式化HDFS 　　 bin/hadoop namenode -format 2.启动Hadoop bin/start-all.sh 3.验证是否完全启动　　使用jps命令，若显示出六项进程的状态，则说明启动成功。2 运行步骤1.建立检测文件夹file 　　在适当位置创建一个文件夹file，并创建两个待检测的文件。　　例如，我在$HAD

对Hadoop自带程序WordCount的解读(转载，自用)

oSayMissyou0的专栏

07-22

809

注:学习备忘自用。原文链接：http://www.2cto.com/database/201403/287775.html 刚开始学习hadoop，对于Hadoop运行原理还不是特别熟悉，通过此例子可以对hadoop运行的原理有个初步的认知。下面是把源代码拷到eclipse程序中，利用此代码（并未修改）测试一下实际的数据并得到结果。（注释是对上以一行的解释） package c

hadoop自带wordcount代码详解

happylzs2008的专栏

09-01

312

http://blog.csdn.net/superman_xxx/article/details/51553120 package cn.chinahadoop;import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration

运行hadoop自带的wordcount

06-28

运行 Hadoop 自带的 wordcount 程序需要几个步骤: 1. 准备输入文件: 将要统计词频的文本文件准备好，并上传到 Hadoop 集群上。 2. 创建输入路径: 使用 Hadoop 命令行工具创建文本文件的输入路径。 3. 运行 ...