伪分布式运行mapreduce

最新推荐文章于 2022-04-01 00:56:14 发布

Narcissus`小暮

最新推荐文章于 2022-04-01 00:56:14 发布

阅读量345

点赞数 1

分类专栏：一步步来学大数据文章标签： hadoop hdfs

本文链接：https://blog.csdn.net/qq_44654498/article/details/106127089

版权

一步步来学大数据专栏收录该内容

15 篇文章 0 订阅

订阅专栏

在使用HDFS之前，需要保证hadoop处于运行状态

在HDFS中创建用户目录

./bin/hdfs dfs -mkdir -p /user/hadoop

在user/hadoop 中建立input文件夹，将etc/hadoop中的xml文件复制到input文件夹中作为输入文件

./bin/hdfs dfs -mkdir input
./bin/hdfs dfs -put ./etc/hadoop/*.xml input

复制完成后，可以通过命令查看文件列表

./bin/hdfs dfs -ls input

在这里插入图片描述
伪分布式运行mapreduce读取的是HDFS的文件

./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep input output 'dfs[a-z.]+'

利用命令查看运行结果，输出结果位于HDFS中

./bin/hdfs dfs -cat output/*

在这里插入图片描述
也可以将运行结果取到本地

rm -r ./output    # 先删除本地的 output 文件夹
./bin/hdfs dfs -get output ./output    
cat ./output/*

hadoop运行程序时，为了防止覆盖结果，程序指定的输出目录不能存在（如output），否则会提示错误，运行前要先删除output文件夹

./bin/hdfs dfs -rm -r output    # 删除 output 文件夹

在这里插入图片描述
如果需要关闭hadoop，运行

./sbin/stop-dfs.sh

优惠劵

Narcissus`小暮

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
伪分布式运行mapreduce

HDFS运行mapreduce示例
复制链接

扫一扫

专栏目录

三 Hadoop运行模式之本地运行模式和伪分布式模式

01-20

文章目录1 本地运行模式1.1 官方Grep案例1.2 官方WordCount案例2 伪分布式模式2.1 启动HDFS并运行MapReduce程序2.1.1 分析2.1.2 执行步骤2.2 启动YARN并运行MapReduce程序2.2.1 分析2.2.1 执行步骤2.3 配置文件说明 ...

伪分布式的搭建（YARN上运行MapReduce 程序）

叁木大数据

12-07

452

伪分布式的搭建（YARN上运行MapReduce 程序）1.启动集群1.1在当前目录下1.2确保NameNode和DataNode已经启动1.3启动ResourceManager1.4启动NodeManager1.5查看启动情况2.集群测试2.1YARN的浏览器页面查看2.2如果文件系统上存在output文件则删除2.3执行MapReduce程序2.4查看运行结果 1.启动集群 1.1在当前目录下...

参与评论您还未登录，请先登录后发表或查看评论

Hadoop2.2.0伪分布式之MapReduce简介

雨钓的专栏

05-26

9140

Hadoop中的MapReduce简述

hadoop伪分布式环境搭建、测试与配置详解

骑着蜗牛向前跑的博客

05-31

580

本文参考均来源于此处http://hadoop.apache.org/docs/r2.6.5/hadoop-project-dist/hadoop-common/SingleCluster.html 刚入门hadoop网上有好多搭建hadoop伪分布式的资料，而且相互之间都有区别，弄得小编有点糊涂，终于搞定了，做个记录方便以后查看，也希望其他新手少走弯路，若有表述不准确大虾还望见谅！

Hadoop伪分布式安装(MapReduce+Yarn)

qq_30130043的博客

03-24

198

调优的关键点就是shufflehttp://localhost:8088 yarn RM端口 find ./ -name "*example*" 找文件-------------------------------作业:1.2台机器配置ssh互相信任关系2.A目录的文件夹c，先移动到B目录;再B目录ln -s /B/c /A/c;再检查权限和用户和用户组MapReduce+Yarn部署...

MapReduce环境搭建步骤（伪分布式）（个人使用版）

qq_39228423的博客

06-10

1973

MapReduce环境搭建步骤 1、mapred-site.xml.template 的修改打开mapred-site.xml.template，其中 opt是你安装hadoop-2.7.5的目录打开该文件命令： vi /opt/hadoop-2.7.5/etc/hadoop/mapred-site.xml.template 输入 <!--使用yarn作为资源管理：local、clas...

Hadoop伪分布式下词频成功案例教程

qq_41615565的博客

12-19

251

Hadoop伪分布式下词频成功案例教程工具准备：JDK（1.8.0）、HADOOP相关（3.0.0）、eclipse（2019） jdk版本如下： hadoop工具如下： windows环境配置 jdk配置如下图： hadoop环境变量配置如下：注意：选择自己对应安装的路径！！并且配置环境变量时，路径名字不要有空格！！图中仅为本文示例，下面的两图可以相同 path中的设置如下：...

伪分布式安装部署（运行MapReduce程序）

rm -rf/坏习惯

04-01

941

启动HDFS并运行MapReduce程序 1. 配置集群（a）配置：hadoop-env.sh Linux系统中获取JDK的安装路径： [ytsky@ hadoop101 ~]# echo $JAVA_HOME /opt/module/jdk1.8.0_202

伪分布式运行Mapreduce程序

weixin_37762923的博客

05-30

822

伪分布式执行wordcount.java：第一步：先把wordcount.java文件复制到ubuntu里面第二步：我们将 Hadoop 的 classhpath 信息添加到 CLASSPATH 变量中，在 ~/.bashrc 中增加如下几行：然后执行source ~/.bashrc使变量生效第三步：使用javac命令编译.java文件就会生成相应的.cla...

伪分布式——启动YARN并运行MapReduce程序（包括配置）

qq_41889799的博客

09-02

405

执行步骤（1）配置集群（a）配置yarn-env.sh 将yarn-env.sh里面的JAVA_HOME路径改为自己的路径，如：export JAVA_HOME=/opt/module/jdk1.8.0_144 （b）配置yarn-site.xml <!-...

伪分布式的搭建（启动HDFS并运行MapReduce程序）

叁木大数据

12-07

964

如果前一章测试成功，那么恭喜你，你已经可以开始新的篇章了（但是如果测试不成功，请务必搭建测试成功后再看此篇章）伪分布式的搭建1、启动HDFS并运行MapReduce程序1.1配置伪分布式集群1.2启动集群1.2.1切换到当前目录1.2.2格式化NameNode1.2.3启动NameNode（执行成功后可执行JPS看是否启动成功）1.2.4启动DataNode1.2.5注意的一些事项1.3查看集群...

Hadoop伪分布式环境搭建

06-25

1、搭建Hadoop伪分布式环境，通过HDFS ...2、创建Java Maven项目，编写MapReduce代码实现对文本中字符（包含大小写字母、数字、各种符号）的统计，将项目打成jar包放入Hadoop伪分布式环境中运行，验证代码是否正确。

Host-noly 模式下hadoop1.1.2伪分布式安装

04-12

本文档主要内容： PieTTY 0.3.26.exe 连接Linux工具 ...11 运行简单的 MapReduce 计算每一步骤配有解释，代码，还有运行结果截图。强烈鄙视一大堆代码和解释，不配执行结果，自己运行时候出一大堆错！！！

Hadoop完全分布式配置.txt

11-05

Hadoop的安装分为单机方式、伪分布式方式和完全分布式方式。 a. 单机模式是Hadoop的默认模式。当首次解压Hadoop的源码包时，Hadoop无法了解硬件安装环境，便保守地选择了最小配置。在这种默认模式下所有3个XML文件...

Hadoop实战大数据大作业

06-08

一个基于Hadoop平台进行的单词统计系统，其中包含了伪分布架构，并且包含HDFS数据存储，结合Java后台利用Mapreduce架包进行单词的统计与分析。包含了完整的实践过程，内涵源代码，以及实验命令，内容丰富，实验过程...

hadoop伪分布式运行模式---启动HDFS并运行MapReduce程序

@小刘同学nice

03-26

1083

配置集群配置：hadoop-env.sh 1）Linux系统中获取JDK的安装路径： [liujh@ hadoop101 ~]# echo $JAVA_HOME /opt/module/jdk1.8.0_144 2）修改JAVA_HOME 路径： export JAVA_HOME=/opt/module/jdk1.8.0_144 配置：core-site.xml <!-- 指定...

【Hadoop】YARN伪分布式部署和MapReduce案例

kunjian的博客

05-19

375

前言：前几篇文章我们介绍了HDFS组件的配置及启动，Yarn是Hadoop集群的资源与作业调度平台，下面介绍下Yarn的伪分布部署及MapReduce简单使用。 1.配置文件及启动 [hadoop@hadoop000 hadoop]$ pwd /opt/software/hadoop-2.8.1/etc/hadoop [hadoop@hadoop000 hadoop]$ cp m...

mapreduce程序开发及伪分布式调试小结

qq_23617681的博客

04-27

837

在eclipse上编写好mapreduce程序后，就可以调试程序。调试有两种方式，本地、hdfs. 博主只有一台电脑，因此用伪分布式模拟远程hdfs。问题一：输入的input、output位置默认情况下，输入的input、output文件位于mapreduce程序根目录下。若要调试mapreduce程序在远程hdfs下的运行效果，效率问题，就需要设置远程hdfs的地址和端

Hadoop伪分布式安装二(MapReduce+Yarn)

12-19

642

上一篇我们已经介绍了HDFS的部署，接着我们进行Hadoop伪分布式MapReduce+Yarn的部署 1.Yarn部署修改mapred-site.xml 文件 [hadoop@zydatahadoop001 hadoop]$ cd /opt/software/hadoop/etc/hadoop/ [hadoop@zydatahadoop001 hadoop]$ ...

给伪分布式hadoop

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交