启动YARN并运行MapReduce程序

最新推荐文章于 2023-09-10 12:41:48 发布

Manfestain

最新推荐文章于 2023-09-10 12:41:48 发布

阅读量1.3k

点赞数

本文链接：https://blog.csdn.net/Beans___Lee/article/details/105194715

版权

本文详细介绍了如何启动YARN集群，包括配置集群、启动ResourceManager和NodeManager，并检查启动状态。接着，演示了在YARN上运行MapReduce程序的步骤，包括删除HDFS的output目录、运行WordCount案例及查看程序详细信息。最后，讨论了配置历史服务器的过程，以解决查看MR程序历史记录时遇到的问题。

摘要由CSDN通过智能技术生成

YARN是主要负责资源调度。之前已经搭建好了Hadoop集群，接下来在集群上启动YARN。

1. 配置YARN并启动

1. 配置集群

1.1 配置yarn-env.sh文件

export JAVA_HOME=你的jkd安装路径

1.2 配置yarn-site.xml文件

<!-- 指定Reduce获取数据的方式-->
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>
 
<!-- 指定YARN的ResourceManager的地址-->
<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>腾讯云服务器的内网ip</value>
</property>

1.3 配置mapred-env.sh文件

export JAVA_HOME=你的jkd安装路径

1.4 将mapred-sit.xml.template重新命名为mapred-site.xml并配置

<!-- 指定MapReduce运行在Yarn上-->
<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Manfestain

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

MapReduce在Yarn上执行流程

weixin_58078092的博客

09-28

699

目录 1、执行流程 2、Yarn核心组件功能 1、执行流程首先，Resource Manager会为每一个application（比如一个用户提交的MapReduce job）在NodeManager里面申请一个container，然后在该container里面启动一个Application Master。container在Yarn中是分配资源的容器（内存、cpu、硬盘等），它启动时便会相应启动一个JVM。然后，Application Master便陆续为application包含的每...

yarn运行mapreduce的工作机制

wu_cai的专栏

09-09

1023

yarn的基本概念 yarn并不清楚用户提交的程序的运行机制 yarn只提供运算资源的调度（用户程序向yarn申请资源，yarn就负责分配资源） yarn中的主管角色叫ResourceManager yarn中具体提供运算资源的角色叫NodeManager 这样一来，yarn其实就与运行的用户程序完全解耦，就意味着yarn上可以运行各种类型的分布式运算程序（mapreduce只是其中的一种），比如m

参与评论您还未登录，请先登录后发表或查看评论

Yarn~Yarn执行MapReduce程序的过程

feizuiku0116的博客

05-08

1255

一、外部执行过程以Java语言为例，完成源码后，打包成一个jar文件，把这个文件放到Hadoop集群中(可以放在任何节点，最好放在NameNode节点)。需要注意的是，不是放在HDFS中，而是放在某节点的本地文件系统中。一般用Java执行jar文件，但是jar依赖Hadoop的Java库，为了避免设置classPath的麻烦，一般用Hadoop的bin/hadoop命令执行jar，执行前还需要把要处理的数据在HDFS中准备好二、内部执行过程 MapReduce程序也算是一个Yarn客户端，它利用

hadoop伪分布式运行模式---启动YARN并运行MapReduce程序

@小刘同学nice

03-26

529

配置集群配置yarn-env.sh 配置一下JAVA_HOME export JAVA_HOME=/opt/module/jdk1.8.0_144 配置yarn-site.xml  <property> <name>yarn.nodemanager.aux-services</name>...

伪分布式——启动YARN并运行MapReduce程序（包括配置）

qq_41889799的博客

09-02

421

执行步骤（1）配置集群（a）配置yarn-env.sh 将yarn-env.sh里面的JAVA_HOME路径改为自己的路径，如：export JAVA_HOME=/opt/module/jdk1.8.0_144 （b）配置yarn-site.xml <!-...

大数据平台构建：YARN中运行Mapreduce程序.pptx

06-21

【大数据平台构建：YARN中运行Mapreduce程序】在大数据处理领域，Apache Hadoop的YARN（Yet Another Resource Negotiator）是一种重要的资源管理和调度系统，它使得不同的计算框架如MapReduce能够高效地运行在...

Hadoop的运行模式（伪分布式）——启动YARN并且运行MapReduce程序

m0_46201836的博客

10-08

402

启动YARN并且运行MapReduce程序 1.配置集群（配置文件的目录-/opt/module/hadoop-2.7.2/etc/hadoop） 1.1 配置yarn-env.sh (JAVA_HOME) export JAVA_HOME=/opt/module/jdk1.8.0_144 1.2 配置yarn-site.xml <configuration> <!-...

Hadoop伪分布式启动HDFS&YARN运行MapReduce

ccccrj博客

08-15

2558

文章目录伪分布式1 启动HDFS并运行MapReduce1.1 配置配置hadoop-env.shcore-site.xmlhdfs-site.xml1.2 启动集群传输文件格式化流程NameNode问题logs日志信息2 启动YARN运行MapReduce配置yarn-env.shyarn-site.xml配置mapred-env.shmapred-site.xml启动集群集群操作3 配置历史服务器mapred-site.xml配置日志集群配置yarn-site.xml 伪分布式服务器配置按照完全分布式

Hadoop伪分布式 => 启动YARN并运行MR程序

小妖666个人笔记

04-06

302

配置集群： cd /opt/module/hadoop-2.9.2/etc/hadoop sudo vim yarn-env.sh 将 # export JAVA_HOME=/home/y/libexec/jdk1.6.0/注释打开修改为 export JAVA_HOME=/opt/module/jdk1.8.0_241 sudo vim yarn-site.xml 在<con...

二十六、伪分布式（Pseudo-Distributed Operation、单节点）之启动YARN并运行MapReduce 程序

基督山伯爵的博客

10-13

562

&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;伪分布式（Pseudo-Distributed Operation、单节点）之启动YARN并运行MapReduce 程序文章步骤：（1）准备1台客户机（2）安装jdk （3）配置jdk环境变量（4）安装hadoop

在Linux将MapReduce程序提交给YARN执行

周星星

11-20

525

什么是YARN，有什么作用 YARN（分布式运算资源调度系统）我们知道我们的分布式文件存储系统HDFS，是将文件进行切块（默认128M）、备份（3份）分布式的存储在集群的各个机器上的；海量的数据需要运算，那如果我们写的java程序，只运行在一个机器上进行处理这些数据块的话，明显是不可取的，所以我们得让程序分布式并行的在各个机器上（mapreduce）运算；而这些程序运行具体使用哪一台的运算资源（CPU、内存、IO、网络等），使用多少，很显然，人为分配这些资源，是很难做到公平和合理的。

YARN环境搭建提交MapReduce作业

qq_27707957的博客

07-14

402

使用版本: hadoop-2.6.0-cdh5.7.0 yarn-site.xml mapred-site.xml 启停YARN cd/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop 由于只有mapred-site.xml.template文件，所以cp mapred-site.xml.template mapred-site.x...

(3)Hadoop 配置部署启动YARN及在YARN上运行MapReduce程序

qq_36291682的博客

03-03

5737

在单节点上配置YARN(1)配置yarn-env.sh 文件查看JAVA_HOME 的值配置文件中的export JAVA_HOME=/opt/modules/jdk1.7.0_79/(2)配置yarn-site.xml YARN上可以运行很多类型框架的应用这里只配置运行MapReduce <property> <name>yarn.nodeman...

hadoop详细笔记(十七) 将MapReduce程序提交到Yarn上运行

HANG.NIAN

07-14

1389

免费视频教程https://www.51doit.com/或者联系博主微信 17710299606 1 windows上 System.setProperty("HADOOP_USER_NAME", "root"); Configuration conf = new Configuration(); // 设置访问的集群的位置 conf.set("fs.defaultFS", "hdfs://doit01:9000"); // 设置yarn的位置 conf.set("mapreduce.fr...

大数据技术之Hadoop：提交MapReduce任务到YARN执行（八）

最新发布

路漫漫其修远兮，吾将上下而求索

09-10

1428

到这一章结束，我们的Hadoop学习就告一段落了。不是说Hadoop技术学完了，而是可以说已经入门了。至于后续要深入学习也有了方向性。下一步我们将讲解Hive技术。过程中会补充MapReduce的一些知识点。最难不过坚持，加油！🧡。

YARN 架构以及 MapReduce 任务提交流程

qq_40727267的博客

09-11

304

一、YARN 架构图分布式资源管理和作业调度二、YARN 中各名词介绍 ResourceManager 负责对各NM上的资源进行统一的管理和调度。为AM分配空闲的Container运行并监控其运行状态。对AM请求的资源分配相应的空闲Container（实际分配有NM进行） Scheduler：调度器根据容量、队列等限制条件（如每个队列分配多少资源，最多执行多少数量的作业等），将系...

Yarn快速系列入门(3) | Yarn和MapReduce的作业提交全过程

不温卜火

04-30

6077

本篇博文，博主为大家介绍Yarn和MapReduce的作业提交全过程。目录一. Yarn的作业提交过程1.1 作业提交1.2 作业初始化1.3 任务分配1.4 任务运行1.5 进度和状态更新1.6 作业完成二. MapReduce的作业提交过程(在此只图片说明) 一. Yarn的作业提交过程作业提交全过程详解 1.1 作业提交第1步：Client调用job.waitForComple...

大数据hadoop框架——MapReduce在YARN运行详解，如何在IDEA中编写MapReduce

蚂蚁

07-02

400

MapReduce运行Yarn上详解（1）Client向Yarn主节点RM提交应用 bin/yarn jar MainClass args （2）RM在某个NM节点上启动一个Container运行AppMaster,运行应用的管理者 Container容器：将资源（CPU和memory）进行隔离，供单独个某个Task独立使用 ...

Apache Hadoop YARN：超越MapReduce的批量处理

在YARN中，NodeManager是运行在每个集群节点上的代理，它负责管理本节点的资源，如内存、CPU等，与ResourceManager通信，报告节点状态，并根据ApplicationMaster的指令启动和停止容器（Container），这些容器就是...