hadoop 本地环境搭建

Table of Contents

 

 

0. 安装版本

1. 安装依赖

2. 安装HDFS

2.1 配置文件

2.2 执行启动命令

3 安装yarn

4 关闭服务器


 

0. 安装版本

hadoop version:2.10.0

run mode: Pseudo-Distributed

 

1. 安装依赖

  1. Java™ must be installed. Recommended Java versions are described at HadoopJavaVersions.

  2. ssh must be installed and sshd must be running to use the Hadoop scripts that manage remote Hadoop daemons.

2. 安装HDFS

 

2.1 配置文件

Use the following:

etc/hadoop/core-site.xml:

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

etc/hadoop/hdfs-site.xml:

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

 

2.2 执行启动命令

  1. Format the filesystem:

      $ bin/hdfs namenode -format
    

     默认情况下namenode数据会存放在临时目录 /tmp/hadoop-adore.chen/dfs/name 下方,电脑重启后丢失。所以修改配置文件
    hdfs-site.xml 同理增加数据节点的存放目录信息。

         修改后的配置文件hdfs-site.xml如下:

<configuration>

        <property>

                <name>dfs.replication</name>

                <value>1</value>

        </property>

        <property>

                <name>dfs.name.dir</name>

                <value>/opt/hadoop-2.10.0/dfs/name/</value>

        </property>

        <property>

                <name>dfs.data.dir</name>

                <value>/opt/hadoop-2.10.0/dfs/data/</value>

        </property>

</configuration>

/opt/hadoop-2.10.0/dfs 是我新建的存放这些数据的目录。

 

2. Start NameNode daemon and DataNode daemon:

  $ sbin/start-dfs.sh

The hadoop daemon log output is written to the $HADOOP_LOG_DIR directory (defaults to $HADOOP_HOME/logs).

Browse the web interface for the NameNode; by default it is available at:

N ameNode - http://localhost:50070/

访问地址栏若是能成功打开,恭喜你安装hdfs成功了。若是不成功,先命令行输入jps查看namenode、datanode、secondary 启动是否成功。我有次就碰到namenode没有启动成功,使用lsof -i:9000查看端口被谁占用。

 

3 安装yarn

  1. Configure parameters as follows:etc/hadoop/mapred-site.xml:

    cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml
    
    <configuration>
        <property>
            <name>mapreduce.framework.name</name>
            <value>yarn</value>
        </property>
    </configuration>
    

    etc/hadoop/yarn-site.xml:

    <configuration>
        <property>
            <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
        </property>
    </configuration>
    
  2. Start ResourceManager daemon and NodeManager daemon:

      $ sbin/start-yarn.sh
    
  3. Browse the web interface for the ResourceManager; by default it is available at:

    ResourceManager - http://localhost:8088/

浏览器若能正常显示,恭喜你安装成功。

 

4 关闭服务器

$ sbin/stop-yarn.sh

$ sbin/stop-dfs.sh

 

参考文章:

https://hadoop.apache.org/docs/r2.10.0/hadoop-project-dist/hadoop-common/SingleCluster.html#Pseudo-Distributed_Operation

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值