初学者都会使用，Hadoop经典案例单词统计Demo演示

最新推荐文章于 2023-05-16 19:51:19 发布

悟空非空也

最新推荐文章于 2023-05-16 19:51:19 发布

阅读量526

点赞数

分类专栏： Hadoop大数据文章标签： hadoop hdfs linux 大数据

禁止转载

本文链接：https://blog.csdn.net/Java_stud/article/details/108577153

版权

Hadoop大数据专栏收录该内容

6 篇文章 1 订阅

订阅专栏

前言

学习Hadoop的第一案例，大家都喜欢使用单词统计demo
该功能的实现，使用了hadoop自带的jar包：hadoop-mapreduce-examples-2.7.4.jar

准备工作

请阅读文章 https://www.bilibili.com/read/cv7591643

步骤

1 打开HDFS的UI界面，查看HDFS中是否有数据文件，默认是没有数据文件。

2 准备文本文件，在Linux系统上编辑一个文本文件，然后上传至HDFS上。

#在linux系统中创建一个目录，创建一个文件，写点内容
mkdir -p /export/data
cd /export/data
vi word.txt (写点内容)
#将该文件上传到hdfs中目录下： /wordcount/input/
hadoop fs -mkdir -p /wordcount/input
hadoop fs -put /export/data/word.txt /wordcount/input/

3 运行hadoop-mapreduce-examples-2.7.4.jar包，实现词频统计。

重要

务必要关闭所有机器hadoop01,hadoop02,hadoop03的防护墙，不然执行会报错

hadoop jar hadoop-mapreduce-examples-2.7.7.jar  wordcount /wordcount/input /wordcount/output

4 查看UI界面，Yarn集群UI界面出现程序运行成功的信息。HDFS集群UI界面出现了结果文件。

总结

通过这样的demo，可以初次体验Hadoop的应用。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

悟空非空也

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Hadoop中单词统计案例运行的代码

03-02

这个任务是Hadoop初学者经常接触的经典示例，它展示了Hadoop MapReduce的基本工作原理。 MapReduce是Hadoop的核心计算模型，由两个主要阶段组成：Map阶段和Reduce阶段。在这个单词统计案例中，我们的目标是读取大量...

调用hadoop下的jar完成单词统计练习——大数据分析及其可视化6

weixin_53472653的博客

11-25

1592

调用hadoop的jar包完成单词统计

1 条评论您还未登录，请先登录后发表或查看评论

大数据Hadoop学习(4)-MapReduce经典案例-单词统计

LoongKK的博客

05-04

2280

大数据Hadoop学习(4)-MapReduce经典案例-单词统计 MapReduce单词统计案例（分别使用样例带的jar包和自己编写代码实现的jar包运行） 1. Hadoop经典案例——单词统计 1）打开HDFS的UI界面，选择Utilities-Browse the file system可查看文件系统里的文件。使用-cat也可。 2）准备文本文件，执行vi word.txt指令新建...

Hadoop（1）：Hadoop 初体验

u013938578的博客

06-29

264

1、HDFS 使用 2、运行mapreduce程序

hadoop2.7.7 mapreduce wordcount

qq 117791303

09-03

226

hadoop2.7.7 mapreduce wordcount

hadoop节点不显示_Hadoop完全分布式环境下，DataNode进程正常启动，但是网页上不显示DataNode节点...

weixin_30356603的博客

12-24

463

19/05/15 11:03:12WARN hdfs.DFSClient: DataStreamer Exceptionorg.apache.hadoop.ipc.RemoteException(java.io.IOException): File/wc_input/file1.txt._COPYING_ could only be replicated to 0 nodes instead of...

大数据实验报告Hadoop编程实现wordcount单词统计程序附源码.doc

12-06

本实验报告旨在介绍使用 Hadoop 编程实现 wordcount 单词统计程序的步骤和代码实现。实验的目的在于熟悉 Hadoop 虚拟机的安装与环境的配置，初步理解 MapReduce 方法，熟悉相关语法，基本掌握编程框架。实验环境：...

hadoop简单单词统计

07-09

通过这个简单的单词统计项目，初学者可以理解Hadoop的基本工作原理，为后续更复杂的大数据处理任务打下基础。同时，这也是实践Hadoop集群操作、MapReduce编程和数据处理流程的良好起点。随着对Hadoop的深入理解和...

Hadoop日志分析、单词统计等功能

最新发布

07-25

HadoopDemo ====================== Hadoop简单应用案例，包括以下内容： - MapReduce - 单词统计 - HDFS基本操作 - web日志分析 - Zookeeper基本使用 - Hive简单操作运行环境 ------- - java 1.8 - hadoop ...

SpringBoot整合Hadoop的案例代码demo,含HDFS文件操作、MapReduce分词操作、案例数据分析，系统推荐等

01-12

对于初学者，这是一个很好的学习资源，可以帮助他们快速掌握Hadoop在实际项目中的应用；对于有经验的开发者，这个案例也是一个有价值的参考，可以启发他们在大数据处理上采用更高效的方法。通过深入研究和实践这个...

MapReduce 测试自带实例 wordcount

Swt_BigData的博客

08-03

1953

Hadoop版本：2.7.6 Jar程序所在目录：是你解压后hadoop解压目录： /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.6.jar 1.本地创建测试文件： mkdir /home/hadoop/data touch a.txt 这里笔者创建了三个txt文件 vim a.t...

2020.11.22大数据学习笔记 hadoop初体验

You1022的博客

11-22

261

环境：CentOS6.5 内容只针对本机，做一个个人的笔记记录 #启动hadoop进程 ./sbin/start-all.sh #想要打开浏览器查看HDFS和YARN的集群状态。必须要执行下面两个语句： #关闭防火墙 service iptables stop #关闭防火墙开机启动 chkconfig iptables off 然后访问http://192.168.153.128:8088查看YARN的集群状态 http://192.168.153.128:50070查看HDFS的集群状态 had

【Hadoop】MapReduce案例——词频统计

啥也不会~

04-21

3891

MapReduce案例——词频统计

使用hadoop进行词频统计测试案例

Long_1979的博客

05-16

2084

简单的使用hadoop进行词频统计处理

03、Hadoop框架HDFS Shell 命令

hujieliang123的博客

02-11

2590

文章目录HDFS Shell命令详细启动脚本介绍HDFS Shell 介绍HDFS Shell 常用操作运行word count 实例 HDFS Shell命令详细启动脚本介绍第一种：全部启动集群所有进程启动：sbin/start-all.sh 停止： sbin/stop-all.sh *启动停止第二种：单独启动hdfs【web端口50070】和yarn【web端口8088】的相关进程启动：sbin/start-dfs.sh sbin/start-yarn.sh 停止：sbin

Hadoop（1）——Hadoop集群构建（12）——集群初体验

weixin_54348877的博客

10-11

1363

hadoop经典案例————单词统计目录 hadoop经典案例————单词统计 1. 打开HDFS的UI界面，查看是否有数据文件，默认是没有数据文件。 2. 准备文本文件，在Linux系统上编辑一个文本文件，然后上传到HDFS上。 2.1 在/export目录下新建data目录，存放数据文件 2.2 在HDFS上创建目录 2.3 将word.txt文件上传到input文件夹下 3. 运行hadoop-mapreduce-examples-2.7.4.jar包，实现词频统计。 3.1 找.

Hadoop案例（2）实现词频统计

Kox_233的博客

11-16

696

Hadoop实现词频统计。

Hadoop经典案例：词频统计

C.W.J

06-06

9630

copy from @寒小阳总体流程 Map阶段代码排序阶段 Reduce阶段本地模拟测试代码 Hadoop集群运行案例这是一个非常经典的例子，几乎在任何的hadoop教材上都会看到它，即使如此，它依旧是最经典最有代表性的案例，学习大数据处理，可以从先理解清楚它入手。总体流程咱们来看看对特别大的文件统计，整个过程是如何分拆的。大家想想词频统计的过程...

hadoop2.7.4 安装配置以及java wordcount 运行出错的总结

LYF1993的博客

10-15

1890

openjdk环境变量设置 ResourceManager和NodeManager有一个进程消失 DataNode 和NameNode 两个进程有一个消失。无法访问 org.apache.commons.cli.Options 找不到或无法加载主类 test.class 的错误 Exception in thread "main" java.lang.ClassNotFoundException 使用命令 hadoop jar

"Hadoop学习案例：使用Java统计单词出现次数

此外，文档还详细描述了如何使用Hadoop进行作业提交，并提供了一个使用Java编写的单词统计案例。在该文档中，首先介绍了Hadoop的核心组件之一：Hadoop分布式文件系统（HDFS）。HDFS是Hadoop的文件系统，能够将大...