MapReduce环境搭建步骤(伪分布式)(个人使用版)

5 篇文章 0 订阅
4 篇文章 0 订阅

MapReduce环境搭建步骤

1、mapred-site.xml.template 的修改

打开mapred-site.xml.template,其中 opt是你安装hadoop-2.7.5的目录
打开该文件命令:

vi /opt/hadoop-2.7.5/etc/hadoop/mapred-site.xml.template

输入

<!--使用yarn作为资源管理:local、classic或yarn-->
<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
</property>
 <!--每个job,reduce任务开启个数-->
<property>
        <name>maprd.reduce.tasks</name>
        <value>1</value>
</property>

在这里插入图片描述

2、yarn-site.xml的修改

打开yarn-site.xml,其中 opt是你安装hadoop-2.7.5的目录
打开该文件命令:

vi /opt/hadoop-2.7.5/etc/hadoop/yarn-site.xml 

输入:

<!--NodeManager上循行的附属服务,配置为该值表示可以运行MR程序-->
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
</property>
<!--Yarn的web管理端口-->
<property>
        <name>yarn.resourcemanager.webapp.address</name>
        <value>master:8088</value>
</property>

在这里插入图片描述

3、启动Yarn

1、启动DHFS

start-dfs.sh

2、启动yarn

start-yarn.sh

该项启动的是ResourceManager、NodeManager

实验室环境(学习研究用)

start-all.sh

注意:
三个指令启动的都是集群的(集群中所有的角色都会启动)
启动hadoop集群(集群结点配置的文件同样),只需要选择一个结点执行start-all.sh就行了。

web访问

输入http://master:8080(本虚拟机IP地址:端口号)
在这里插入图片描述

测试程序WordCount

1、切换目录至 hadoop-2.7.5/share/hadoop/mapreduce/中
命令:

cd hadoop-2.7.5/share/hadoop/mapreduce/

2、执行hadoop jar指定输入目录和输出目录
命令:

hadoop jar hadoop-mapreduce-examples-2.7.5.jar wordcount /hello.txt /wordcount

输入路径可以是目录也可以是文件,输入目录必须是空目录或者不存在。

3、查看输出结果

hdfs dfs -cat /wordcount/part-r-00000

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值