使用hadoop做wordcount笔记

最新推荐文章于 2024-04-19 23:59:11 发布

老胡当道卧

最新推荐文章于 2024-04-19 23:59:11 发布

阅读量350

点赞数

分类专栏：零散的学习笔记

本文链接：https://blog.csdn.net/sinat_27339001/article/details/72912433

版权

零散的学习笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

以前写的mapreduce的wordcount，都忘了怎么执行了

hadoop  jar
/home/dmc/hadoop/share/hadoop/tools/lib/hadoop-streaming-2.6.0.jar
-mapper mapper1.py
-file mapper1.py
-reducer reducer1.py
-file reducer1.py
-input /user/hujianqiu/wordcount/input_word/*
-output output_word

其中，调用的jar包可不是随便找一个的，而是要用本机安装的hadoop-streaming的jar包，因而要找一下hadoop安装在哪里，可以使用如下命令：

locate *share/hadoop/tools/lib/hadoop-streaming*

这样就能很快地定位到hadoop的安装目录了

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

老胡当道卧

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

hadoop实现wordcount的三种方法

cai_4399的博客

11-03

1万+

很多小伙伴在搭建完hadoop集群后，还不太会在上面跑测试程序，作为大数据入门学习的Hello world程序，我总结了三种方法。第一种：用hadoop上自带的jar包（hadoop-mapreduce-examples-2.7.0.jar）实现第二种：不用自带的包，我们自己导出JAR包，在集群中运行（3个java源程序，我这里就不提供了）第三种：在IDE中运行，eclipse怎么连接集群请参考这篇博文：http://blog.csdn.net/dopamy_busymonkey/article/de

【hadoop 学习笔记-2】wordcount 完整实例

金戈铁马

07-26

2143

开发工具 IDEA 创建Maven项目 New Project-> Maven ，取名为 WordCountDemo ，然后点Finish即可。 POM.XML中添加项目依赖 <dependencies> <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-c...

参与评论您还未登录，请先登录后发表或查看评论

hadoop实现wordcount

05-24

通过hadoop 来进行感情分析，代码可以实现将几个GB大小的数据，来统计词的数量

Hadoop环境搭建及常见问题解决（保姆级教程）

tangyi2008的专栏

12-13

1万+

学习大数据的路上，肯定少不了Hadoop的陪伴。在学习Hadoop之初，一件"痛苦"的事情莫过于装环境，看着别人万事亨通，而自己跌跌撞撞，个中心酸，有几人懂... 本教程为保姆式教程，力图帮您排忧解难。主要内容如下：【资源准备】 => 【环境准备】 => 【JDK的安装】 => 【Hadoop的安装】 => 【伪分布式的配置】 => 【启动与测试】 => 【常见错误及解决办法】

Hadoop实现WordCount（从零开始）

qq_54003651的博客

09-23

2874

非常简单的手把手教学

hadoop自带示例wordcount

侠客小虎的博客

01-17

2万+

1.首先确认你的hadoop启动了。 master与slave启动方式相同，进入hadoop目录下的sbin目录，命令:$cd /home/hadoop/hadoop/sbin (根据个人安装的hadoop目录调整) 启动hadoop：(1)$./start-dfs.sh (2)$./start-yarn.sh 启动后的效果如图：master如图1，slave如图2 图1 图2

【Hadoop】在笔记本虚拟机上部署Hadoop集群后运行Wordcount程序报错Connection refused

Louis Lee's Blog

03-02

856

在笔记本虚拟机上部署Hadoop集群后运行Wordcount程序报错Connection refused

大数据：Hadoop入门案例，命令行wordcount统计(1)

2401_84123171的博客

04-19

897

学完之后，若是想验收效果如何，其实最好的方法就是可自己去总结一下。比如我就会在学习完一个东西之后自己去手绘一份xmind文件的知识梳理大纲脑图，这样也可方便后续的复习，且都是自己的理解，相信随便瞟几眼就能迅速过完整个知识，脑补回来。下方即为我手绘的Android框架体系架构知识脑图，由于是xmind文件，不好上传，所以小编将其以图片形式导出来传在此处，细节方面不是特别清晰。但可给感兴趣的朋友提供完整的Android框架体系架构知识脑图原件（包括上方的面试解析xmind文档）

大数据：Hadoop入门案例，命令行wordcount统计

最新发布

2401_84123188的博客

04-19

1060

以Hadoop自带的wordcount为例，说明如何在Windows环境下，统计若干文件中的单词出现次数。上传要统计的文件。假设在计算机本地有三个文件，f1.txt，f2.txt，f3.txt，这个三个文件位于E:/myfile文件夹下，需要把myfile整个文件上传到HDFS上。本例目的就是统计存放到HDFS中的f1,f2,f3这三个文件中的单词个数。1、需要现在HDFS上创建一个文件夹，假设这个文件夹名字为test_dir。

hadoop学习笔记：运行wordcount对文件字符串进行统计案例

被基金支配的打工人

10-20

1030

我最近使用四台Centos虚拟机搭建了一套分布式hadoop环境，简单模拟了线上上的hadoop真实分布式集群，主要用于业余学习大数据相关体系。其中，一台服务器作为NameNode，一台作为Secondary NameNode，剩下两台当做DataNodes节点服务器，类似下面这样一个架构—— NameNode Secondary NameNode DataNodes master1(192.168.200.111) √ master2(192.1

Hadoop MapReduce（WordCount）学习笔记七

停止的闹钟博客

08-15

164

MapReduce是一种程序开发模式，可以使用大量服务器来并行处理。MapReduce，简单地说，Map就是分配工作，Reduce就是将工作结果汇总整理。 ·首先使用Map将待处理的数据分割成很多的小分数据，由每台服务器分别运行。再通过Reduce程序进行数据合并，最后汇总整理出结果。本章将以WordCount.java作为范例来介绍MapReduce。 7.1简单介绍WordCount.jav...

hadoop 实现简单的wordcount实例

coding乐园

03-29

1077

前置条件：在hadoop官网下载某个版本的zip文件，这里下载的版本是2.7.3，将其解压刀你的电脑的某个目录中，这里为：D:\dev\hadoop-2.7.3 下载地址：http://apache.fayea.com/hadoop/common/hadoop-2.7.3/ src的是文件源码，有需要的可以下载下来研究~ 配置环境变量： HADOOP_HOME D:\dev\had

Hadoop下WordCount开发实战（附源码）

叶小刀

07-13

4544

首先安装Eclipse和hadoop的插件，打开eclipse后看到项目侧会看到DFS开启Hadoop，单击右下角的如下图中的小象编辑DFS的连接配置信息点击finish右击DFS刷新，会看到hdfs下的目录：++++++++++++++++++++++++++++++++++++++++++++++++++++右击File新建项目：输入项目名WordCount将所安装的hadoop下的share...

Hadoop--MapReduce实现WordCount全步骤

xiaolei565的专栏

03-15

1125

新建maven项目 1、 +Create New Project… ->Maven -> Next 2、填写好GroupId和ArtifactId 点击Next -> Finish 编写wordcount项目 1、建立项目结构目录右键java -> New -> package 输入package路径（本例是com.hadoop.wdcount）建立pac...

手把手教你使用Hadoop自带的wordcount程序

qq_43008103的博客

07-13

5346

切换到hadoop用户，启动Hadoop su hadoop start-all.sh mr-jobhistory-daemon.sh start historyserver

改改host，轻松登录dropbox！（For Windows）