启动YARN并运行MapReduce程序

YARN是主要负责资源调度。之前已经搭建好了Hadoop集群,接下来在集群上启动YARN。


1. 配置YARN并启动

1. 配置集群

1.1 配置yarn-env.sh文件

export JAVA_HOME=你的jkd安装路径

1.2 配置yarn-site.xml文件

<!-- 指定Reduce获取数据的方式-->
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>
 
<!-- 指定YARN的ResourceManager的地址-->
<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>腾讯云服务器的内网ip</value>
</property>

1.3 配置mapred-env.sh文件

export JAVA_HOME=你的jkd安装路径

1.4 将mapred-sit.xml.template重新命名为mapred-site.xml并配置

<!-- 指定MapReduce运行在Yarn上-->
<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
YARN框架对比MapReduce1.0的改进 随着大数据时代的到来,大数据处理框架也在不断地发展和完善。MapReduce1.0曾经是Hadoop生态圈中最重要的组件之一,但是它存在着一些局限性。为了解决这些问题,Hadoop社区开发了YARN框架,它可以更好地支持多种应用程序,并且更加灵活和可扩展。 下面是YARN框架相对于MapReduce1.0的改进: 1. 更好的资源管理:MapReduce1.0将资源管理和作业调度紧密耦合在一起,这意味着只能运行MapReduce作业。而YARN框架采用了更加灵活的资源管理方式,可以支持多种应用程序,包括Hadoop、Spark、Storm等等。 2. 更好的作业调度:YARN框架采用了分布式作业调度器,可以更加灵活地调度作业。这使得作业的启动和停止更加快速,而且更加容易实现资源共享和作业排队。 3. 更好的容错性:MapReduce1.0的容错性有限,如果某个节点出现故障,整个作业都会失败。而YARN框架采用了更加可靠的容错机制,可以自动重启失败的任务,并且可以在多个节点之间重新分配任务,保证作业的顺利运行。 4. 更好的可扩展性:MapReduce1.0的可扩展性有限,只能通过增加更多的节点来扩展。而YARN框架采用了更加分布式的架构,可以更加容易地扩展,支持更多的节点和更大规模的数据处理。 总的来说,YARN框架相对于MapReduce1.0的改进是非常显著的。它提供了更加灵活、可扩展和可靠的资源管理、作业调度和容错机制。这使得它成为了大数据处理框架中最重要的组件之一。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值