hadoop2.2.0集群安装

原创 2013年12月02日 09:11:56

说明:目前官方hadoop2.2只有32位的版本,安装到64位肯定有问题,比如执行jar包会提示没有本地库。。。。。。。。。如果要安装64位的,需要自己编译,这里不做阐述,一下都以32位说明。

环境:试验使用的虚拟机ubuntu12.0432位)。Jdk使用的1.71.6也可以)。网络配置好,相互可以ping通,java环境安装完毕。

 

第一部分 Hadoop 2.2 下载

          Hadoop我们从Apache官方网站直接下载最新版本Hadoop2.2。官方目前是提供了linux32位系统可执行文件,所以如果需要在64位系统上部署则需要单独下载src 源码自行编译(这里使用的32位)。

下载地址:http://apache.claz.org/hadoop/common/hadoop-2.2.0/

如下图所示,下载红色标记部分即可。如果要自行编译则下载src.tar.gz.

 

第二部分 Hadoop 2.2 安装准备

2.1java配置

第三部分 Hadoop 2.2 安装

3.1集群环境

         172.72.103.230   master

         172.72.103.231   node1       172.72.103.231   node2       172.72.103.231   node3

3.1.1修改主机名

         Vi  /etc/hostname,直接修改即可

3.1.2修改/etc/hosts

         172.72.103.230   master

         172.72.103.231   node1      

172.72.103.232   node2      

172.72.103.233   node3

3.1.3 master无密登录node节点和本身

master节点上安装完成后会在~目录(当前用户主目录,即这里的/home/hadoop)下产生一个隐藏文件夹.sshls  -a 可以查看隐藏文件)。如果没有这个文件,自己新建即可(mkdir .ssh)。

具体步骤如下:

1进入.ssh文件夹

2 ssh-keygen -t  rsa 之后一路回车(产生秘钥)

3id_rsa.pub 追加到授权的 key 里面去(cat id_rsa.pub >> authorized_keys

4重启 SSH 务命令使其生效 :service ssh restart

此时已经可以进行ssh localhost的无密码登陆

     【注意】:以上操作在每台机器上面都要进行。(node节点无密登录自身不是必须的,可以省去,但是安装ssh.ssh文件必须要有)

设置远程无密码登陆

这里只有mastermaster,如果有多个namenode,或者rm的话则需要打通所有master都其他剩余节点的免密码登陆。(将masterauthorized_keys追加到所有nodeauthorized_keys后面)

3.2解压hadoop文件

在每台机器上建立/opt(一定使用你要安装hadoop的用户操作,总之保证安装包都是hadoop用户所有即可)将hadoop包放入解压

3.3创建hadoop的需要文件(元数据目录)

         master上的/home/hadoop下创建如下目录

~/dfs/name

~/dfs/data

~/temp

这些目录是根据下面的配置文件里自己所写的路径创建,可以自己决定名称与路径

3.4配置文件

    这里要涉及到的配置文件有7个:

~/hadoop-2.2.0/etc/hadoop/hadoop-env.sh

~/hadoop-2.2.0/etc/hadoop/yarn-env.sh

~/hadoop-2.2.0/etc/hadoop/slaves

~/hadoop-2.2.0/etc/hadoop/core-site.xml

~/hadoop-2.2.0/etc/hadoop/hdfs-site.xml

~/hadoop-2.2.0/etc/hadoop/mapred-site.xml

~/hadoop-2.2.0/etc/hadoop/yarn-site.xml

以上个别文件默认不存在的,可以复制相应的template文件获得。

配置文件1hadoop-env.sh

修改JAVA_HOME值(export JAVA_HOME=/usr/java/jdk1.7.0_40

配置文件2yarn-env.sh

修改JAVA_HOME值(exportJAVA_HOME=/usr/java/jdk1.7.0_40

配置文件3slaves (这个文件里面保存所有slave节点)

写入以下内容:

node1

node2

Node3

配置文件4core-site.xml

<configuration>

                <property>

                                <name>fs.defaultFS</name>

                                <value>hdfs://master:9000</value>

                </property>

       <property>

                                <name>io.file.buffer.size</name>

                                <value>131072</value>

                </property>

       <property>

                                <name>hadoop.tmp.dir</name>

                                <value>file:/home/hadoop/tmp</value>

                                <description>Abase for other temporary directories.</description>

                </property>

        <property>

               <name>hadoop.proxyuser.hduser.hosts</name>

               <value>*</value>

       </property>

                 <property>

               <name>hadoop.proxyuser.hduser.groups</name>

               <value>*</value>

       </property>

</configuration>

配置文件5hdfs-site.xml

<configuration>

       <property>

                <name>dfs.namenode.secondary.http-address</name>

               <value>master:9001</value>

        </property>

         <property>

                  <name>dfs.namenode.name.dir</name>

                 <value>file:/home/hadoop/dfs/name</value>

            </property>

           <property>

                    <name>dfs.datanode.data.dir</name>

                    <value>file:/home/hadoop/dfs/data</value>

            </property>

            <property>

                     <name>dfs.replication</name>

                     <value>3</value>

             </property>

             <property>

                     <name>dfs.webhdfs.enabled</name>

                     <value>true</value>

         </property>

</configuration>

配置文件6mapred-site.xml

<configuration>

                <property>

                                <name>mapreduce.framework.name</name>

                                <value>yarn</value>

                </property>

                <property>

                                <name>mapreduce.jobhistory.address</name>

                                <value>master:10020</value>

                </property>

                <property>

               <name>mapreduce.jobhistory.webapp.address</name>

               <value>master:19888</value>

       </property>

</configuration>

配置文件7yarn-site.xml

<configuration>

                 <property>

               <name>yarn.nodemanager.aux-services</name>

               <value>mapreduce_shuffle</value>

        </property>

                 <property>

               <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

               <value>org.apache.hadoop.mapred.ShuffleHandler</value>

        </property>

        <property>

               <name>yarn.resourcemanager.address</name>

               <value>master:8032</value>

       </property>

                <property>

               <name>yarn.resourcemanager.scheduler.address</name>

               <value> master:8030</value>

               </property>

               <property>

                       <name>yarn.resourcemanager.resource-tracker.address</name>

                        <value> master:8031</value>

               </property>

               <property>

                       <name>yarn.resourcemanager.admin.address</name>

                        <value> master:8033</value>

               </property>

                <property>

               <name>yarn.resourcemanager.webapp.address</name>

               <value> master:8088</value>

       </property>

</configuration>

以上配置在每个机器上都相同,也可以在一台配置后复制到其他节点。

3.5启动验证

进入安装目录: cd  /opt/hadoop-2.2.0/

格式化namenode./bin/hdfs namenode –format

启动hdfs: ./sbin/start-dfs.sh

此时在master上面运行的进程有:namenode secondarynamenode

各个node上面运行的进程有:datanode

启动yarn: ./sbin/start-yarn.sh

此时在master上面运行的进程有:namenode secondarynamenoderesourcemanager

各个node上面运行的进程有:datanode nodemanaget

master上:

查看集群状态:./bin/hdfs dfsadmin –report

查看文件块组成:  ./bin/hdfsfsck / -files -blocks

查看HDFS:    http://172.72.103.230:50070

查看RM:    http:// 172.72.103.230:8088

 

hadoop2.2.0集群安装和配置

hadoop2.0已经发布了稳定版本了,增加了很多特性,比如HDFS HA、YARN等。 注意:apache提供的hadoop-2.2.0的安装包是在32位操作系统编译的,因为hadoop依赖一些C+...

hadoop 2.2.0集群安装

1. 网络设置禁用防火墙service iptables stop禁用IPv6打开/etc/modprobe.d/dist.conf,添加:alias net-pf-10 offalias ipv6 ...

Ubuntu系统下安装并配置Hadoop-2.2.0集群

转自:http://blog.csdn.net/cruise_h/article/details/18716645
  • sole_cc
  • sole_cc
  • 2014年07月16日 11:35
  • 415

Apache Hadoop 2.2.0集群安装

Apache Hadoop 2.2.0集群安装(1)[翻译] 用途 此文档描述了如何安装、配置和维护一个重大集群从几个节点到上千节点。 初次接触hadoop建议先从单...

ubuntu14.04下hadoop2.2.0集群安装

集群搭建 1、系统配置以及安装SSH无密码登陆环境(master&slaves): 修改本机(master)和子节点(slaveN)机器名:打开/etc/hostname文件 sudo gedi...

Hadoop2.2.0集群安装配置

文章来源 http://blog.csdn.net/licongcong_0224/article/details/12972889

hadoop 2.2.0集群安装

相关阅读: hbase 0.98.1集群安装 本文将基于hadoop 2.2.0讲解其在linux集群上的安装方法,并对一些重要的设置项进行解释,本文原文链接:http://blo...

Hadoop2.2.0集群在RHEL6.2下的安装实战

本文介绍了一个Hadoop2.2.0集群的搭建过程,在2台4G内存的酷睿双核PC机上,使用VMWare WorkStation虚拟了4个RHEL6.2(1G内存、单核CPU、10G硬盘),总计用10个...

hadoop-2.2.0集群上运行Hive 0.13 出错的解决方案

Hadoop-2.2.0集群上运行Hive 0.13 出错的解决方案

国内最全最详细的hadoop2.2.0集群的HA高可靠的最简单配置

简介   hadoop中的NameNode好比是人的心脏,非常重要,绝对不可以停止工作。在hadoop1时代,只有一个NameNode。如果该NameNode数据丢失或者不能工作,那么整个...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:hadoop2.2.0集群安装
举报原因:
原因补充:

(最多只允许输入30个字)