hadoop的安装和配置(二)伪分布模式

博主会用三篇文章为大家详细的说明hadoop的三种模式:

本地模式

伪分布模式

完全分布模式


 

伪分布式模式:

这篇为大家带来hadoop的伪分布模式:

从最简单的方面来说,伪分布模式就是在本地模式上修改配置文件:

core-site.xml;hdfs-site.xml;mapred-site.xml;yarn-site.xml4

备注:本地模式见hadoop的安装与配置——第一章:本地模式

思路简介

|——————————|

|  ①:ssh免密登陆   |

|  ②:修改配置文件   |

|  ③:格式化hadoop  |

|  ④:启动hadoop     |

|——————————|

一:ssh的免密登陆

生成id_rsa和id_rsa.pub

[root@localhost hadoop]# ssh-keygen -t rsa

 

进入/root/.ssh下:将id_rsa.pub的信息发在authorized_keys下:

1 [root@localhost hadoop]# cd /root/.ssh/
2 [root@localhost .ssh]# cat id_rsa.pub >> authorized_keys
3 [root@localhost .ssh]# ls
4 authorized_keys  id_rsa  id_rsa.pub  known_hosts

 

SSH免密登陆详细文档链接地址


 

二:关于配置文件的主要内容

core-site.xml:指定hadoop的主节点master

hdfs-site.xml:指定hadoop中的文件副本数

mapred-site.xml:指定mapreduce的资源管理

yarn-site.xml:——————————————

配置文件可以从hadoop的官方文档中下载,有详细解释,这里为了减少对大家的干扰,就直接选取了部分:

 1 [root@localhost hadoop]# cd /usr/local/hadoop/etc/hadoop/
 2 [root@localhost hadoop]# pwd
 3 /usr/local/hadoop/etc/hadoop
 4 [root@localhost hadoop]# ls
 5 capacity-scheduler.xml      httpfs-env.sh            mapred-env.sh
 6 configuration.xsl           httpfs-log4j.properties  mapred-queues.xml.template
 7 container-executor.cfg      httpfs-signature.secret  mapred-site.xml
 8 core-site.xml               httpfs-site.xml          mapred-site.xml.template
 9 hadoop-env.cmd              kms-acls.xml             slaves
10 hadoop-env.sh               kms-env.sh               ssl-client.xml.example
11 hadoop-metrics2.properties  kms-log4j.properties     ssl-server.xml.example
12 hadoop-metrics.properties   kms-site.xml             yarn-env.cmd
13 hadoop-policy.xml           log4j.properties         yarn-env.sh
14 hdfs-site.xml               mapred-env.cmd           yarn-site.xml

 

core-site.xml配置修改:

1 <configuration>
2         <property>
3                 <name>fs.default.name</name>
4                 <value>hdfs://localhost</value>(主节点为本机localhost)
5         </property>
6 </configuration>

hdfs-site.xml配置修改:

1 <configuration>
2         <property>
3                 <name>dfs.replication</name>
4                 <value>1</value>(伪分布模式)
5         </property>
6 </configuration>

mapred-site.xml配置修改:

备注:

1 若没有mapred-site.xml,选择以下方法复制
2 [root@localhost hadoop]# cp mapred-site.xml.template mapred-site.xml
1 <configuration>
2         <property>
3                 <name>mapreduce.framework.name</name>
4                 <value>yarn</value>(选择yarn来mapreduce)
5         </property>
6 </configuration>

yarn-site.xml配置修改:

 1 <configuration>
 2         <property>
 3                 <name>yarn.resourcemanager.hostname</name>
 4                 <value>localhost</value>
 5         </property>
 6         
 7         <property>
 8                 <name>yarn.nodemanager.aux-services</name>
 9                 <value>mapreduce_shuffle</value>
10         </property>
11 </configuration>

 


 

三:格式化hadoop

hadoop namenode -format

 

格式化一次就好了


 

四:启动hadoop

start-all.sh

备注:关闭hadoop:stop-all.sh

想要知道hadoop是否配置成功,那么就使用jps来查询一下进程吧!

我们知道hadoop主要分为存储和计算,所以我们主要查询一下存储和计算的进程是否启动:

1 [root@localhost hadoop]# jps
2 31105 NodeManager(从)(计算)
3 30675 SecondaryNameNode(主-副本)(计算)
4 31139 Jps
5 30822 ResourceManager(主)(计算)
6 30510 DataNode(从)(存储)
7 30382 NameNode(主)(存储)

有不清楚的地方欢迎大家提问,有问题欢迎大家给出方法!

2017-12-26 15:32:06

 


 

本文版权声明:

本文作者:魁·帝小仙

博文主页地址:http://www.cnblogs.com/dxxblog/

欢迎对小博主的博客内容批评指点,如果问题,可评论或邮件联系(2335228250@qq.com)

欢迎转载,转载请在文章页面明显位置给出原文链接,谢谢

 

转载于:https://www.cnblogs.com/dxxblog/p/8118254.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Hadoop是一个开源的分布式计算框架,可以用处理大规模数据集的分布式存储和计算。它支持在单机模式和分布模式下进行安装和部署。 1. 单机模式(Standalone Mode):在单机模式下,Hadoop运行在单个节点上,所有的Hadoop组件(如HDFS和MapReduce)都在同一个进程中运行。这种模式适用于开发和测试,以及小规模数据集的处理。 2. 分布模式(Pseudo-Distributed Mode):在分布模式下,Hadoop模拟了一个分布式环境,但实际上所有的组件都运行在同一台机器上。每个组件都在独立的进程中运行,并通过本地主机名进行通信。这种模式适用于在单台机器上模拟分布式环境进行开发和测试。 要同时安装单机模式和分布模式,你可以按照以下步骤进行操作: 1. 下载Hadoop安装包并解压缩到本地目录。 2. 配置Hadoop的环境变量,包括JAVA_HOME和HADOOP_HOME。 3. 修改Hadoop配置文件,主要包括core-site.xml、hdfs-site.xml和mapred-site.xml。 4. 在core-site.xml中配置Hadoop的文件系统相关参数,如fs.defaultFS和hadoop.tmp.dir。 5. 在hdfs-site.xml中配置Hadoop分布式文件系统(HDFS)的相关参数,如dfs.replication和dfs.namenode.name.dir。 6. 在mapred-site.xml中配置MapReduce的相关参数,如mapreduce.framework.name和mapreduce.jobtracker.address。 7. 启动Hadoop的单机模式,可以使用命令`start-all.sh`或`start-dfs.sh`和`start-yarn.sh`分别启动HDFS和YARN。 8. 验证单机模式是否正常运行,可以通过访问Hadoop的Web界面来查看集群状态。 9. 在分布模式下运行Hadoop,需要修改一些配置文件,如hdfs-site.xml和mapred-site.xml中的一些参数,以便适应分布式环境。 10. 启动Hadoop分布模式,同样可以使用命令`start-all.sh`或`start-dfs.sh`和`start-yarn.sh`来启动HDFS和YARN。 11. 验证分布模式是否正常运行,同样可以通过访问Hadoop的Web界面来查看集群状态。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值