hadoop 安装部署-HDFS/YARN/MR

1.HDFS安装

1.配置hdfs的NameNode(core-site.xml)

vi hadoop-2.7.2/etc/hadoop/core-site.xml
<configuration>
<property>
<name>fs.defaultFS</name>
    <value>hdfs://kafka1:9000</value>
<description>配置NameNode的URL</description>
</property>

<!-- 指定Hadoop运行时产生文件的存储目录 -->
<property>
        <name>hadoop.tmp.dir</name>
        <value>/root/ysw/hadoop/hadoop-2.7.2/data/tmp</value>
</property>
</configuration>

2.配置HDFS路径(hdfs-site.xml)

vi hadoop-2.7.2/etc/hadoop/hdfs-site.xml
<configuration>
<!-- 指定HDFS副本的数量 -->
<property>
        <name>dfs.replication</name>
        <value>1</value>
</property>
<property>
  <name>dfs.namenode.name.dir</name>
  <value>/root/ysw/hadoop/hadoop-2.7.2/data/namenode</value>
  <description>NameNode存储名称空间和事务日志的本地文件系统上的路径</description>
</property>
<property>
  <name>dfs.datanode.data.dir</name>
  <value>/root/ysw/hadoop/hadoop-2.7.2/data/datanode</value>
  <description>DataNode存储名称空间和事务日志的本地文件系统上的路径</description>
</property>
</configuration>

3.启动HDFS

(a)格式化NameNode(第一次启动时格式化,以后就不要总格式化)

bin/hdfs namenode -format

(b)启动NameNode

sbin/hadoop-daemon.sh start namenode

(c)启动DataNode

sbin/hadoop-daemon.sh start datanode

查看是否启动成功

jps

在这里插入图片描述

4.web端查看HDFS文件系统

http://kafka1:50070/dfshealth.html#tab-overview

5.操作hdfs

1.在HDFS文件系统上创建一个文件夹命名为input

bin/hdfs dfs -mkdir -p /user/ysw/input

在这里插入图片描述
在这里插入图片描述
2.将测试文件内容上传到文件系统上
现在本地任意位置新建文件

vi b.txt

写入如下内容:

hello hdfs
hello hdfs
hello hdfs
hello hdfs
hello hdfs
hello hdfs

将b.txt文件内容上传到HDFS文件系统上

bin/hdfs dfs -put input/hdfs/b.txt /user/ysw/input/

在这里插入图片描述
在页面上查上传到hdfs文件
在这里插入图片描述
使用命令查上传到hdfs文件

bin/hdfs dfs -ls  /user/ysw/input/
bin/hdfs dfs -cat  /user/ysw/ input/b.txt

在这里插入图片描述

2.YARN安装

1.配置yarn-env.sh

配置一下JAVA_HOME, 如果已经配置了环境的JAVA_HOME这里可以不配置
在这里插入图片描述

2.配置yarn-site.xml

vi etc/hadoop/yarn-site.xml
<configuration>
<!-- Site specific YARN configuration properties -->
<property>
  <name>yarn.nodemanager.aux-services</name>
  <value>mapreduce_shuffle</value>
</property>
<property>
  <name>yarn.scheduler.minimum-allocation-mb</name>
  <value>512</value>
  <description>为每个容器请求分配的最小内存限制资源管理器(512M)</description>
</property>
<property>
  <name>yarn.scheduler.maximum-allocation-mb</name>
  <value>4096</value>
  <description>为每个容器请求分配的最大内存限制资源管理器(4G)</description>
</property>
<property>
  <name>yarn.nodemanager.vmem-pmem-ratio</name>
  <value>4</value>
  <description>虚拟内存比例,默认为2.1,此处设置为4倍</description>
</property>
<!-- 指定YARN的ResourceManager的地址 -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>kafka1</value>
</property>
</configuration>

3.启动yarn

(a)启动前必须保证NameNode和DataNode已经启动
(b)启动ResourceManager

sbin/yarn-daemon.sh start resourcemanager

(c)启动NodeManager

 sbin/yarn-daemon.sh start nodemanager

(a)YARN的浏览器页面查看
http://kafka1:8088/cluster

在这里插入图片描述

3.MapReduce程序在YARN模式运行

1.配置集群在YARN上运行MR

配置:mapred-env.sh
配置一下JAVA_HOME, 如果已经配置了环境的JAVA_HOME这里可以不配置

配置mapres的运行模式为yarn
配置: (对mapred-site.xml.template重新命名为) mapred-site.xml

mv mapred-site.xml.template mapred-site.xml
vi etc/hadoop/mapred-site.xml
<configuration>
<property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
  <description>执行MapReduce的方式:yarn/local</description>
</property>
</configuration>

2.MapReduce程序在YARN模式运行

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /user/ysw/input/b.txt /user/ysw/output

在这里插入图片描述
在这里插入图片描述

3.yarn 查看结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值