Hadoop伪分布搭建

hadoop伪分布模式配置

1、配置好网络,关闭iptables,关闭selinux。

配置网络参考:Linux配置静态ip访问外网

关闭防火墙:
    service iptables stop

    chkconfig iptables off
关闭selinux:
    setenforce 0

    vi /etc/selinux/config
        SELINUX=disabled
        

2、安装好jdk并加入环境变量。

1、卸载原来的java
[root@Linux000 usr]# rpm -qa | grep java
java-1.7.0-openjdk-1.7.0.131-2.6.9.0.el6_8.x86_64
tzdata-java-2016j-1.el6.noarch
java-1.6.0-openjdk-1.6.0.41-1.13.13.1.el6_8.x86_64
[root@Linux000 usr]# rpm -e --nodeps  java-1.7.0-openjdk-1.7.0.131-2.6.9.0.el6_8.x86_64
[root@Linux000 usr]# rpm -e --nodeps tzdata-java-2016j-1.el6.noarch
[root@Linux000 usr]# rpm -e --nodeps java-1.6.0-openjdk-1.6.0.41-1.13.13.1.el6_8.x86_64

2、上传jdk-8u311-linux-x64.rpm到/usr/local目录下,以此执行
    mkdir /usr/java 
    rpm -ivh jdk-8u311-linux-x64.rpm

3、配置环境变量:
    vi /etc/profile
        export JAVA_HOME=/usr/java/jdk1.8.0_311-amd64
        export PATH=$PATH:$JAVA_HOME/bin
    source /etc/profile

3、安装好hadoop并加入环境变量  && 创建hadoop数据目录

安装:
    cd /opt/source && tar -zxf hadoop-2.6.5.tar.gz -C /opt/apps

环境变量:
    vi /etc/profile
        export HADOOP_HOME=/opt/apps/hadoop-2.6.5
        export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

    source /etc/profile

#输入start双击tab键如果出现hadoop的相关脚本,则环境变量配置成功



创建目录:
mkdir -p /opt/apps/hadoop-2.6.5/data/namenode  /opt/apps/hadoop-2.6.5/data/datanode  /opt/apps/hadoop-2.6.5/data/tmp

4、配置单击版免密码登录

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub > ~/.ssh/authorized_keys

#执行以上两条命令后,若执行ssh localhost不需要输入密码,则配置成功

5、配置 /opt/apps/hadoop-2.6.5/etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.8.0_311-amd64

6、配置 /opt/apps/hadoop-2.6.5/etc/hadoop/core-site.xml

    <!-- namenode和其他组件的通信使用hdfs协议
		Linux001表示namenode在Linux001主机上
		9000 namenode的服务通过端口9000发布
		namenode进程在Linux001主机上
	-->
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://Linux001:9000</value>
	</property>



        <!--指定指定namenode数据存放路径-->
    	<property>
	    	<name>hadoop.name.dir</name>
	    	<value>/opt/apps/hadoop-2.6.5/data/namenode</value>
	    </property>
        <!--指定指定Hadoop数据存放路径-->
    	<property>
	    	<name>hadoop.data.dir</name>
	    	<value>/opt/apps/hadoop-2.6.5/data/datanode</value>
	    </property>
        <!--指定指定Hadoop临时数据存放路径-->
    	<property>
	    	<name>hadoop.tmp.dir</name>
	    	<value>/opt/apps/hadoop-2.6.5/data/tmp</value>
	    </property>

7、配置/opt/apps/hadoop-2.6.5/etc/hadoop/hdfs-site.xml  

	<!-- 指定block默认的副本数 -->
	<property>
		<name>dfs.replication</name>
		<value>1</value>
	</property>

	<!-- 指定secondarynamenode的http服务的地址
	实际上也就指定了secondarynamenode进程所在的主机
	-->
	<property>
		<name>dfs.namenode.secondary.http-address</name>
		<value>Linux001:50090</value>
	</property>

8、配置/opt/apps/hadoop-2.6.5/etc/hadoop/mapred-site.xml

cp /opt/apps/hadoop-2.6.5/etc/hadoop/mapred-site.xml.template /opt/apps/hadoop-2.6.5/etc/hadoop/mapred-site.xml

vi mapred-site.xml
    <!--配置mapreduce运行的平台-->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>

9、配置/opt/apps/hadoop-2.6.5/etc/hadoop/yarn-site.xml

vi yarn-site.xml
    <!--配置yarn的主节点-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>Linux001</value>
    </property>
    <!--配置MapReduce处理数据的方式-->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>    

10、配置 /opt/apps/hadoop-2.6.5/etc/hadoop/slaves

Linux001 

11、格式化HDFS

/opt/apps/hadoop-2.6.5/bin/hdfs namenode -format

注意
    修改了core-site.xml文件必须重新格式化

格式化成功:

11、启动HDFS 

. start-dfs.sh 
    #已经配好了hadoop的环境变量,在任意路径都可以执行这条命令

启动成功后可用ip:50070在浏览器上访问hdfs的web界面

额外的工作

     

问题:
    观察启动hdfs打印的日志发现启动namenodes、datanode、secondary namenodes的机器不一样,如何修改成一样的。

解决:
    1、关闭所有hadoop相关进程:kill -9 $(pgrep -f hadoop)。
    2、针对secondary namenode的修改:
            vi hdfs-site.xml

                <property>
                     <name>dfs.namenode.secondary.http-address</name>
                     <value>Linux001:50090</value>
                </property>
                <property>
                     <name>dfs.namenode.secondary.https-address</name>
                     <value>Linux001:50091</value>
                </property> 
    3、针对datanode的修改:
        vi slaves
            Linux001
    4、针对namenode的修改
        vi core-site.xml
            	<property>
		            <name>fs.defaultFS</name>
		            <value>hdfs://Linux001:9000</value>
	            </property>
    

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

二百四十九先森

你的打赏是我努力的最大动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值