用hadoop自带的wordcount测试

最新推荐文章于 2025-03-16 22:40:22 发布

嘿lemon

最新推荐文章于 2025-03-16 22:40:22 发布

阅读量7.7k

点赞数 4

分类专栏： Hadoop Hadoop实战

本文链接：https://blog.csdn.net/u012343297/article/details/79978526

版权

Hadoop 同时被 2 个专栏收录

9 篇文章

订阅专栏

Hadoop实战

6 篇文章

订阅专栏

1、创建文件example.txt,并将其拷贝到hdfs的/user/root中

./hadoop fs -put /root/example.txt /user/root

2、执行hadoop-mapreduce-examples-2.8.0.jar

./hadoop jar ../share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.0.jar wordcount /user/root/example.txt /output

3、按照搭建集群这篇配置/opt/hadoop-2.8.0/etc/hadoop/mapred-site.xml，wordcunt会卡在INFO mapreduce.Job: map 0% reduce 0%

        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property

按照如上配置，则使用yarn来进行计算，那么必须启动nodemanager,

如果不使用yarn,进行mapreduce.job.tracker配置，也可以用MRv2来执行job，这样就不需要启动nodemanager：

<property>
        <name>mapreduce.job.tracker</name>
        <value>hdfs://hserver2:8001</value>
        <final>true</final>
<property>

这里写图片描述

修改后，重新运行wordcunt
这里写图片描述
4、查看输出的统计

./hadoop fs -cat /output/part-r-00000

这里写图片描述

至此，wordcunt测试完成。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

嘿lemon

关注关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Hadoop MapReduce测试word count功能

QYHuiiQ

04-13

1636

在hadoop的mapreduce目录下自带有一个hadoop-mapreduce-examples-2.7.5.jar(官方已经为我们写好了用java实现word count的jar)可以用来测试word count的功能。测试之前先创建用来做词频统计的文件： [root@hadoop01 ~]# mkdir word_count_input [root@hadoop01 ~]# cd word_count_input [root@hadoop01 word_count_input]# vi fil

hadoop-2.7.3的WordCount测试

dongweizu33的专栏

05-10

684

测试hadoop的 WordCount 1、创建两个文本 [root@bigdata01 /]# mkdir input [root@bigdata01 /]# cd input [root@bigdata01 input]# echo "hello world" >test1.txt [root@bigdata01 input]# echo "hello hadoop" >tes

参与评论您还未登录，请先登录后发表或查看评论

hadoop测试worldcount

旧书不厌百回读，熟读深思子自知

08-31

290

hadoop测试worldcount，统计每个单词出现的个数一、首先创建新目录testFiles，并在目录下创建两个测试数据文本文件如下： [code="shell"][root@SC-026 hadoop-1.0.3]# mkdir testFiles [root@SC-026 hadoop-1.0.3]# cd testFiles/ [root@SC-026 testFiles]...

Hadoop分布式部署实现wordcount教程

最新发布

qq_53844788的博客

03-16

233

Hadoop分布式部署实现wordcount教程

数据挖掘实验：使用 Hadoop 实现 WordCount 应用

ProgramNovice的博客

09-19

8268

数据挖掘实验：使用 Hadoop 实现 WordCount 应用

Hadoop之WordCount测试

月亮的技术博客

10-04

1194

Hadoop是Apache旗下的一个用Java语言实现的开源软件框架，是一个开发和运行处理大规模数据的软件平台。Hadoop的核心组件包括Hadoop分布式文件系统（HDFS）和MapReduce编程模型。HDFS是一个高度容错的系统，用于存储大规模数据集，具有高可靠性、高扩展性和高吞吐率的特点。MapReduce则是一个用于处理这些数据集的编程模型，它简化了并行编程的复杂性，使得开发者可以专注于业务逻辑的实现。Hadoop的优势在于其高可靠性、高扩展性、高效性、高容错性以及低成本。

Hadoop2.5.1测试（运行自带的wordcount）

u012859691的专栏

03-20

881

一、准备工作启动hadoop（如有疑问见上篇博文），jps查看进程：hadoop@h1:~$ jps 3395 SecondaryNameNode 5222 Jps 3177 NameNode 4394 JobHistoryServer 3565 ResourceManager二、进行测试1、建立输入文件：echo "My first hadoop example. Hello Hadoop in

hadoop wordcount 调试

Rudyee的专栏

08-28

1010

第一次安装hadoop，跑wordcount，遇到不少问题，在这里总结一下我遇到的怪异问题和我的解决方法。第一。hadoop命令不能使用要使用hadoop命令，得在/etc/profile 里面添加 HADOOP_HOME. 个人怀疑在conf/hadoop-env.sh里面配置直也可以，但是没有试验，以后再验证。 export HADOOP_HOME_W

Hadoop之MapReduce01【自带wordcount案例】

2301_82241675的博客

05-25

570

这些 MapReduce程序的代码都在hadoop-mapreduce-examples-2.6.4.jar包里,这个jar包在 hadoop安装目录下的/share/hadoop/mapreduce/目录里。Mapreduce 是一个分布式运算程序的编程框架，是用户开发“基于 hadoop 的数据分析应用”的核心框架,Mapreduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序，并发运行在一个 hadoop 集群上.| MapReduce | 分布式计算系统 |

【云计算】Hadoop，测试wordcount

清宵尚温的博客

11-02

1304

《云计算》课程报告课程实验题目：hadoop的测试时间：15周-18周一、课程实验目的与要求熟练掌握Linux的相关命令并会配置java环境。学会安装Hadoop并配置Hadoop的环境。深入理解MapReduce并会进行Hadoop的编程。熟练搭建平台和环境，能执行MapReduce实例，同时会使用自带工具TestDFSIO来测试I/O。二、课程实验内容 Install V...

运行Hadoop自带的WordCount测试样例

10-10

运行Hadoop自带的WordCount测试样例通常是在Hadoop MapReduce框架下完成的，它是一个经典的示例，用于演示分布式计算的基本原理，即数据分割、映射处理和归约操作。以下是步骤概述： 1. **启动Hadoop集群**：首先，...

hadoop集群通用wordcount测试程序

02-11

通用的wordcount 程序，不依赖具体Hadoop平台，做research时很有用

hadoop-wordcount测试程序

09-04

hadoop-wordcount测试程序，jar包，单词统计的不二之选

基于Hadoop的WordCount案例实现（Linux版本）

围炉夜敲的博客

10-09

6104

基于Hadoop的WordCount案例实现（Linux版本）注意事项准备工作统计文本软件具体步骤使用Xsehll连接虚拟机创建本地存放文件目录使用Xftp导入统计文本在HDFS文件系统中创建统计文本数据输入目录向输入目录传输统计文本使用Hadoop自带的MapReduce编程模型进行统计运算查看程序运行结果并导出文件删除HDFS中output目录中的内容

Docker部署hadoop+运行wordcount详解

A18937260063的博客

06-07

2782

Docker部署hadoop+运行wordcount详解

Hadoop【单机安装-测试程序WordCount】

weixin_30845171的博客

03-07

273

Hadoop程序说明，就是创建一个文本文件，然后统计这个文本文件中单词出现过多少次！（MapReduce 运行在本地启动JVM ）第一步创建需要的文件目录，然后进入该文件中进行编辑 1.1 1.2 使用命令 vi wc.input 进入编辑编辑如下内容第二步运行WordCount程序，数据来源于HDFS上 2.1 将创建出来...

Hadoop笔记之二：运行WordCount实验

luchi007的专栏

10-17

6166

实验环境Hadoop版本：Hadoop2.7.3 linux版本：Ubuntu JDK版本：JDK1.7实验步骤设置HADOOP的PATH和HADOOP CLASSPATH(这里假设java的相关路径已经配置好) export HADOOP_HOME=/home/luchi/Hadoop/hadoop-2.7.3 export PATH=${HADOOP_HOME}/bin:$PATH exp

运行hadoop自带的word count小案例

浅陌夏初。的博客

10-08

3629

1. 创建一个文件上传目录 1）首先进入到hadoop文件夹下（命令：cd /usr/local/hadoop）； 2）创建目录“/test/wordcount”，用来存放hadoop自带的wordcount例子的数据文件。 bin/hadoop fs -mkdir -p /test/wordcount （创建上传文件目录） bin/hadoop fs -ls / （查看创建...

hadoop 部署后测试运行wordcount

RD_moon的博客

06-19

1103

想测试一下自己的 hadoop 是否安装成功1. hadoop fs -mkdir /input在HDFS中创建input文件目录 2 hadoop fs -put LICENSE.txt /input我当前在hadoop的目录下，有个LICENSE.txt的文件，把它放到hdfs的input目录下面3 hadoop fs -ls /input查看文件是否正确传入到/input目录下或者 ...