Hadoop伪分布搭建

最新推荐文章于 2024-04-23 18:34:19 发布

二百四十九先森

最新推荐文章于 2024-04-23 18:34:19 发布

阅读量771

点赞数

分类专栏： Hadoop核心技术文章标签： hadoop

本文链接：https://blog.csdn.net/pengzonglu7292/article/details/78822951

版权

Hadoop核心技术专栏收录该内容

26 篇文章 0 订阅

订阅专栏

hadoop伪分布模式配置

1、配置好网络，关闭iptables，关闭selinux。

配置网络参考：Linux配置静态ip访问外网

关闭防火墙：
    service iptables stop

    chkconfig iptables off
关闭selinux:
    setenforce 0

    vi /etc/selinux/config
        SELINUX=disabled

2、安装好jdk并加入环境变量。

1、卸载原来的java
[root@Linux000 usr]# rpm -qa | grep java
java-1.7.0-openjdk-1.7.0.131-2.6.9.0.el6_8.x86_64
tzdata-java-2016j-1.el6.noarch
java-1.6.0-openjdk-1.6.0.41-1.13.13.1.el6_8.x86_64
[root@Linux000 usr]# rpm -e --nodeps  java-1.7.0-openjdk-1.7.0.131-2.6.9.0.el6_8.x86_64
[root@Linux000 usr]# rpm -e --nodeps tzdata-java-2016j-1.el6.noarch
[root@Linux000 usr]# rpm -e --nodeps java-1.6.0-openjdk-1.6.0.41-1.13.13.1.el6_8.x86_64

2、上传jdk-8u311-linux-x64.rpm到/usr/local目录下,以此执行
    mkdir /usr/java 
    rpm -ivh jdk-8u311-linux-x64.rpm

3、配置环境变量：
    vi /etc/profile
        export JAVA_HOME=/usr/java/jdk1.8.0_311-amd64
        export PATH=$PATH:$JAVA_HOME/bin
    source /etc/profile

3、安装好hadoop并加入环境变量 && 创建hadoop数据目录

安装：
    cd /opt/source && tar -zxf hadoop-2.6.5.tar.gz -C /opt/apps

环境变量：
    vi /etc/profile
        export HADOOP_HOME=/opt/apps/hadoop-2.6.5
        export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

    source /etc/profile

#输入start双击tab键如果出现hadoop的相关脚本，则环境变量配置成功



创建目录：
mkdir -p /opt/apps/hadoop-2.6.5/data/namenode  /opt/apps/hadoop-2.6.5/data/datanode  /opt/apps/hadoop-2.6.5/data/tmp

4、配置单击版免密码登录

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub > ~/.ssh/authorized_keys

#执行以上两条命令后，若执行ssh localhost不需要输入密码，则配置成功

5、配置 /opt/apps/hadoop-2.6.5/etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.8.0_311-amd64

6、配置 /opt/apps/hadoop-2.6.5/etc/hadoop/core-site.xml

    <!-- namenode和其他组件的通信使用hdfs协议
		Linux001表示namenode在Linux001主机上
		9000 namenode的服务通过端口9000发布
		namenode进程在Linux001主机上
	-->
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://Linux001:9000</value>
	</property>



        <!--指定指定namenode数据存放路径-->
    	<property>
	    	<name>hadoop.name.dir</name>
	    	<value>/opt/apps/hadoop-2.6.5/data/namenode</value>
	    </property>
        <!--指定指定Hadoop数据存放路径-->
    	<property>
	    	<name>hadoop.data.dir</name>
	    	<value>/opt/apps/hadoop-2.6.5/data/datanode</value>
	    </property>
        <!--指定指定Hadoop临时数据存放路径-->
    	<property>
	    	<name>hadoop.tmp.dir</name>
	    	<value>/opt/apps/hadoop-2.6.5/data/tmp</value>
	    </property>

7、配置/opt/apps/hadoop-2.6.5/etc/hadoop/hdfs-site.xml

	<!-- 指定block默认的副本数 -->
	<property>
		<name>dfs.replication</name>
		<value>1</value>
	</property>

	<!-- 指定secondarynamenode的http服务的地址
	实际上也就指定了secondarynamenode进程所在的主机
	-->
	<property>
		<name>dfs.namenode.secondary.http-address</name>
		<value>Linux001:50090</value>
	</property>

8、配置/opt/apps/hadoop-2.6.5/etc/hadoop/mapred-site.xml

cp /opt/apps/hadoop-2.6.5/etc/hadoop/mapred-site.xml.template /opt/apps/hadoop-2.6.5/etc/hadoop/mapred-site.xml

vi mapred-site.xml
    <!--配置mapreduce运行的平台-->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>

9、配置/opt/apps/hadoop-2.6.5/etc/hadoop/yarn-site.xml

vi yarn-site.xml
    <!--配置yarn的主节点-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>Linux001</value>
    </property>
    <!--配置MapReduce处理数据的方式-->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

10、配置 /opt/apps/hadoop-2.6.5/etc/hadoop/slaves

Linux001

11、格式化HDFS

/opt/apps/hadoop-2.6.5/bin/hdfs namenode -format

注意
    修改了core-site.xml文件必须重新格式化

格式化成功：

11、启动HDFS

. start-dfs.sh 
    #已经配好了hadoop的环境变量，在任意路径都可以执行这条命令

启动成功后可用ip:50070在浏览器上访问hdfs的web界面

额外的工作

问题：
    观察启动hdfs打印的日志发现启动namenodes、datanode、secondary namenodes的机器不一样，如何修改成一样的。

解决：
    1、关闭所有hadoop相关进程：kill -9 $(pgrep -f hadoop)。
    2、针对secondary namenode的修改：
            vi hdfs-site.xml

                <property>
                     <name>dfs.namenode.secondary.http-address</name>
                     <value>Linux001:50090</value>
                </property>
                <property>
                     <name>dfs.namenode.secondary.https-address</name>
                     <value>Linux001:50091</value>
                </property> 
    3、针对datanode的修改：
        vi slaves
            Linux001
    4、针对namenode的修改
        vi core-site.xml
            	<property>
		            <name>fs.defaultFS</name>
		            <value>hdfs://Linux001:9000</value>
	            </property>

二百四十九先森

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
Hadoop伪分布搭建

hadoop伪分布模式配置1、配置好网络，关闭iptables，关闭selinux。配置网络参考：Linux配置静态ip访问外网关闭防火墙： service iptables stop chkconfig iptables off关闭selinux: setenforce 0 vi /etc/selinux/config SELI...
复制链接

扫一扫