Hadoop(一)伪分布式安装Hadoop

Hadoop(一)乌班图伪分布式安装Hadoop

1.打开终端


2.安装jdk,去官网中下载jdk(此处只作简单的介绍)-->解压-->配置环境


3.配置SSH免登录




4.配置hadoop环境


4.2解压hadoop-2.6.4.tar.gz,并重命名为hadoop
tar xzvf hadoop-2.4.0.tar.gz
mv hadoop-2.4.0 hadoop

4.3配置环境变量,内容如下,而后使之生效:source /etc/environment


4.4在这里提一句,单机模式无需仁和配置 可以直进行测试,略之

4.5伪分布式模式配置:

4.5.1在当前用户目录下创建文件夹tmp/hadoop_tmp

4.5.2etc/hadoop下存放配置文件

4.5.2.1修改hadoop-env.sh
将export JAVA_HOME=${JAVA_HOME}改为你自己安装的jdk路径:
export JAVA_HOME=/usr/lib/java/jdk1.8.0_73

4.5.2.2修改core-site.xml
<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
    <final>true</final>
  </property>

  <property>
    <name>hadoop.tmp.dir</name>
    <value>/home/judy/tmp/hadoop_tmp</value>
  </property>
</configuration>

 
  
 
4.5.2.3修改hdfs-site.xml:
<configuration>
 <property>
      <name>dfs.namenode.name.dir</name>
      <value>/home/judy/Desktop/Hadoop/hadoop/dfs/namenode</value>
      <final>true</final>
    </property>      
     <property>
       <name>dfs.datanode.data.dir</name>
       <value>/home/judy/Desktop/Hadoop/hadoop/dfs/datanode</value>
      <final>true</final>
    </property>
    <property>
      <name>dfs.http.address</name>
      <value>localhost:50070</value>
       <description>
         The address and the base port where the dfs namenode web ui will listen on.
If the port is 0 then the server will start on a free port.
      </description>
    </property>
    <property>
      <name>dfs.replication</name>
      <value>1</value>
    </property>
    <property>
      <name>dfs.permissions</name>
      <value>false</value>
    </property>
</configuration>

 
  
 
4.5.2.4修改mapred-site.xml
<configuration>
  <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
    </property>
    <property>
      <name>mapred.job.tracker</name>
      <value>hdfs://localhost:9001</value>
    </property>
        <property>  
          <name>mapred.system.dir</name>  
          <value>file:/home/ylf/hadoop/mapred/system</value>  
          <final>true</final>  
        </property>  
       
        <property>  
          <name>mapred.local.dir</name>  
          <value>file:/home/ylf/hadoop/mapred/local</value>  
          <final>true</final>  
        </property> 
</configuration>

 
  
 
4.2.2.5修改yarn-site.xml
<configuration>

<!-- Site specific YARN configuration properties --> <property>

    <name>yarn.nodemanager.aux-services</name>

    <value>mapreduce_shuffle</value>

    <description>shuffle service that needs to be set for Map Reduce to run</description>

  </property>

  <property>

    <name>yarn.resourcemanager.hostname</name>

    <value>localhost</value>

    <description>hostname of Resource Manager</description>

  </property>

</configuration>

 
  
 
4.2.2.6修改slaves文件
localhost

 
 

默认就是localhost,所以不用修改。

启动伪分布式模式:

第一次启动都要格式化下数据文件,命令:

./bin/hdfs namenode -format

 
 格式化将会在在hdfs文件夹下新建datanode和namenode 
 

4.3启动hadoop

./sbin/start-all.sh

 
 停止 
 

./sbin/stop-all.sh

 
  
 
4.4查看

jps

 
 

4.5JobHistoryServer启动


4.6启动结果

web访问端口

NameNode50070
ResourceManager8088
MapReduce JobHistory Server19888





以上为乌班图的搭建方式;

我自己还在centos 6.5上进行了搭建,参考的是:http://www.linuxidc.com/Linux/2016-07/133508.htm

并且遇到了一些坑,希望对你们有帮助:http://blog.csdn.net/u013725455/article/details/70147331

以及如需要对外访问记得添加防火墙端口:

8088:hadoop集群管理界面

50070:hdfs的管理界面

9000:hdfs仓储地址





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值