hadoop部署(伪分布式,分布式)

hadoop由三种模型:
1、单机模型:测试使用
2、伪分布式模型:运行于单机
3、分布式模型:real集群模型

一、伪分布式

hadoop基于java语言;
hadoop-2.6 —– jdk 1.6+
hadoop-2.7 —– jdk1.7+

1、安装hadoop并设置其所需的环境变量

解压安装包至如下目录
[root@server2 ~]# mkdir /bdapps
[root@server2 bdapps]# tar zxf jdk-7u79-linux-x64.tar.gz  
[root@server2 bdapps]# ln -sv hadoop-2.7.3/ hadoop
[root@server2 bdapps]# tar zxf jdk-7u79-linux-x64.tar.gz  
[root@server2 bdapps]# ln -sv jdk1.7.0_79/ jdk
/etc/profie.d/hadoop.sh里面设置环境变量,设定hadoop的运行环境:

这里写图片描述

设置java运行环境:

这里写图片描述
这里写图片描述
这里写图片描述

2、创建hadoop进程的用户及相关目录

出于安全考虑,一般用特定用户来运行hadoop的不同守护进程,分别用yarn,hdfs,mapred来运行其相应进程。

这里写图片描述

创建数据目录和日志目录:

这里写图片描述

在安装目录下创建logs目录,并修改hadoop所有文件的属主属组。

这里写图片描述
这里写图片描述

3、配置hadoop

etc/hadoop/core-site.xml文件包含了NameNode主机地址,监听端口等信息,对于伪分布式模型来说,其主机地址为localhost,NameNode默认使用的端口为8020。
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:8020</value>
        <final>true</final>
    </property>
</configuration>
etc/hadoop/hdfs-site.xml用于配置/HDFS的相关属性,例如数据块的副本参数,NN和DN用于存储数据的目录,=。数据块的副本对于伪分布式来说应该为1,而NN和DN用于存储数据的目录为前面专门为其创建的路径,前面的步骤也为SNN创建了相关目录,这里也一并设置其为启用状态。
```
<configuration>
 <property>
      <name>dfs.replication</name>
      <value>1</value>
 </property>
 <property>
       <name>dfs.namenode.name.dir</name>
       <value>file:///data/hadoop/hdfs/nn</value>
 </property>
 <property>
       <name>dfs.datanode.data.dir</name>
       <value>file:///data/hadoop/hdfs/dn</value>
 </property>
 <property>
       <name>fs.checkpoint.data.dir</name>
       <value>file:///data/hadoop/hdfs/snn</value>
 </property>
 <property>
       <name>fs.checkpoint.edits.dir</name>
       <value>file:///data/hadoop/hdfs/snn</value>
 </property>
</configuration>
etc/hadoop/mapred-site.xml文件用于配置集群的MapReduce,framework,此处应该使用yarn,另外可使用的值还有local和classic,mapred-site.xml默认不存在,但有模块文件mapred-site.xml.template,将其复制成mapred-site.xml即可
<configuration>
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
</configuration>
etc/hadoop/yarn-site.xml用于配置YARN进程及YARN相关属性。首先要指明ResourceManager守护进程的主机和监听的端口,对于伪分布式模型来讲。其主机为localhost,默认端口为8032,其次需要指定ResourceManager使用的scheduler,一及NodeManager的辅助服务。

                
  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值