windows下搭建hadoop集群

最新推荐文章于 2024-04-28 04:40:12 发布

suifengdechen

最新推荐文章于 2024-04-28 04:40:12 发布

阅读量2.5k

点赞数

本文链接：https://blog.csdn.net/suifengdechen/article/details/77895951

版权

1. 安装虚拟机配置网络, 本教程是基于centos下进行的

2.改Hadoop节点的名字

sudo vi /etc/sysconfig/network

3.将节点名字和ip地址进行映射

sudo vi /etc/hosts

192.168.2.201 weekend110

4. 安装jdk

#解压，将jdk解压到app目录中

tar -zxvf jdk-7u55-linux-i586.tar.gz -C app/

sudo vi /etc/profile

#在文件最后添加

export JAVA_HOME=/home/hadoop/app/jdk-7u_65-i585

export PATH=$PATH:$JAVA_HOME/bin

#刷新配置

source /etc/profile

5.安装hadoop

tar -zxvf hadoop-2.7.3.tar.gz -C app/

进入etc下修改配置

vi hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.7.0_65

vi core-site.xml

        
        <property>
            <name>fs.defaultFS</name>
                    <value>hdfs://weekend110:9000</value>
            </property>

            <property>
                   <name>hadoop.tmp.dir</name>
      <value>/home/hadoop/app/hadoop-2.4.1/tmp</value> //所有的数据都放在tmp下的
        </property>

hdfs-site.xml

<name>dfs.replication</name>

</property>

mv mapred-site.xml.template mapred-site.xml
          vim mapred-site.xml
          
          <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
         </property>

yarn-site.xml 资源调用的一些配置

          
          <property>
                  <name>yarn.resourcemanager.hostname</name>
                  <value>weekend110</value>
          </property>
          
          <property>
                  <name>yarn.nodemanager.aux-services</name>
                  <value>mapreduce_shuffle</value>
         </property>

注意：

配置完之后，还有一些要做，因为hadoop都是一些网络程序，namenode，datanode都是网络服务，这些服务会被linux防火墙关掉，方法一，将linux中hadoop用到的端口都打开，或者把防火墙关闭就可以了

防火墙是一个服务，把这个服务关掉就可以了

sudo service iptables status

关掉防火墙

sudo service iptables stop

因为它是一个自启服务，再次启动还会打开，所以要把自启动服务给关掉，不让它自启

查看状态

sudo chkconfig iptables --list

用sudo chkconfig iptables off 就可以关掉了

将hadoop添加到环境变量中

export HADOOP_HOME=/home/hadoop/app/hadoop-2.4.1