CentOS伪分布式部署Hadoop

    在CentOS7.3上单机部署Hadoop 2.8.5。

1、基础环境配置

配置好JDK环境,关闭防火墙,关闭selinux

[root@centos]vim /etc/selinux/config
#bled This file controls the state of SELinux on the system.
# SELINUX= can take one of these three values:
#     enforcing - SELinux security policy is enforced.
#     permissive - SELinux prints warnings instead of enforcing.
#     disabled - No SELinux policy is loaded.
SELINUX=disabled
# SELINUXTYPE= can take one of three two values:
#     targeted - Targeted processes are protected,
#     minimum - Modification of targeted policy. Only selected processes are protected.
#     mls - Multi Level Security protection.
SELINUXTYPE=targeted

计算机重命名:

查看主机名

[root@centos /]# hostnamectl status

修改主机名

[root@centos /]# hostnamectl set-hostname hadoop.master

修改hosts

[root@centos hadoop /]#vim /etc/hosts

在最后加上一行:ip 和主机名的映射,如192.168.2.5 hadoop.master

2、SSH免密码登录

通过$:ssh localhost命令查看是否需要密码,如果需要执行以下命令:

[root@centos hadoop]# ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
[root@centos hadoop]# cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
[root@centos hadoop]# chmod 0600 ~/.ssh/authorized_keys

[root@centos hadoop]# cd /root
[root@centos ~]# ssh-keygen -t rsa
[root@centos ~]# cat .ssh/id_rsa.pub >> .ssh/authorized_keys

如果是root用户,在root目录下生成.ssh文件夹,可将.ssh文件夹拷贝到其他机器同,完成局域网多机器互信访问。

3、解压缩Hadoop

[root@centos hadoop]tar –zxvf hadoop-2.8.5.tar.gz -C /usr/hadoop/

配置hadoop环境变量。

[root@centos hadoop]vim /etc/profile
#set hadoop environment
export HADOOP_HOME=/usr/hadoop/hadoop-2.8.5
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

让环境变量生效,命令行执行:source /etc/profile

主要配置slaves,hadoop-env.sh,core-site.xml,hdfs-site.xml,mapred-site.xml,yarn-site.xml等6个配置文件。

4、编辑slaves

删除缺省的localhost,将slave机器的hostname添加到其中,如hadoop.master。

[root@centos hadoop-2.8.5]# vim etc/hadoop/slaves

5、配置hadoop运行环境文件hadoop-env.sh

[root@centos hadoop-2.8.5]# vim etc/hadoop/hadoop-env.sh
export JAVA_HOME=/usr/java/jdk1.8.0_151

6、配置集群文件core-site.xml 

进入/usr/hadoop/hadoop-2.8.5/etc/hadoop目录:

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop.master:9000</value>
        <description>指定HDFS(namenode)的访问地址</description>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/data/hadoop/tmp</value>
        <description>hdfs临时文件存储路径</description>
    </property>
</configuration>

7、配置HDFS文件hdfs-site.xml 

进入/usr/hadoop/hadoop-2.8.5/etc/hadoop目录:

<configuration>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/data/hadoop/dfs/name</value>
        <description>hdfs元数据的物理存储位置 </description>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/data/hadoop/dfs/data</value>
        <description>hdfs数据的物理存储位置</description>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
        <description>设置hdfs副本数量,默认为3</description>
    </property>
    <property>
        <name>dfs.blocksize</name>
        <value>67108864</value>
        <description>block默认128兆(134217728),这里设置为64兆(67108864)</description>
    </property>
    <property>
        <name>dfs.permissions</name>
        <value>false</value>
        <description>是否启用hdfs权限</description>
    </property>
</configuration>

8、启动停止HDFS

第一次启动hdfs需要格式化,之后启动就不需要的:

[root@centos]# cd /usr/hadoop/hadoop-2.8.5
[root@centos hadoop-2.8.5]# ./bin/hdfs namenode -format

启动命令:

[root@centos hadoop-2.8.5]# ./sbin/start-dfs.sh

启动NameNode、SecondaryNameNode和DataNode,启动后,浏览器输入网址:http://192.168.2.5:50070,打开hadoop的dfs页面。

用jps命令查看启动进程:

[root@centos hadoop-2.8.5]# jps
3969 NameNode
4275 SecondaryNameNode
4389 Jps
4071 DataNode

测试hdfs,创建一个test文件夹:

[root@centos hadoop-2.8.5]# ./bin/hdfs dfs -mkdir /test

停止命令:

[root@centos hadoop-2.8.5]# ./sbin/stop-dfs.sh

9.配置yarn(mapred-site.xml)

         Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。

        配置mapred-site.xml。注意,hadoop里面默认是mapred-site.xml.template 文件,如果配置yarn,把mapred-site.xml.template   重命名为mapred-site.xml 。如果不启动yarn,把重命名还原。

[root@centos hadoop]# mv mapred-site.xml.template mapred-site.xml
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
        <description>启用yarn作为资源管理框架</description>
    </property>
</configuration>

          配置yarn-site.xml

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
        <description>配置MapReduce的Shuffle</description>
    </property>
</configuration>

10、启动停止yarn

启动yarn,启动了resourcemanager和nodemanager

[root@centos hadoop-2.8.5]# ./sbin/start-yarn.sh  
starting yarn daemons
starting resourcemanager, logging to /usr/hadoop/hadoop-2.8.5/logs/yarn-root-resourcemanager-centos.hbase.out
localhost: starting nodemanager, logging to /usr/hadoop/hadoop-2.8.5/logs/yarn-root-nodemanager-centos.hadoop1.out

浏览器输入:http://192.168.2.5:8088/  (8088是默认端口,如果端口占用,先把占用的端口杀掉 netstat -ano),打开Hadoop集群页面。

用jps命令查看启动进程:

[root@centos hadoop-2.8.5]# jps
9985 NodeManager
10404 Jps
9861 ResourceManager

停止yarn:

[root@centos hadoop-2.8.5]# ./sbin/stop-yarn.sh

11、启动停止Hadoop(YARN、HDFS、MapReduce)

[root@centos hadoop-2.8.5]# ./sbin/start-all.sh
[root@centos hadoop-2.8.5]# ./sbin/stop-all.sh

用jps命令查看启动进程:

[root@centos hadoop-2.8.5]# jps
11666 ResourceManager
11414 SecondaryNameNode
10888 NameNode
11789 NodeManager
12317 Jps
11102 DataNode

 

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 首先安装Java环境,Hadoop需要Java环境支持,可以使用yum命令安装: ``` yum install java-1.8.0-openjdk-devel.x86_64 ``` 2. 下载Hadoop安装包,可以从官网下载最新版本: ``` wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.3.0/hadoop-3.3.0.tar.gz ``` 3. 解压Hadoop安装包: ``` tar -zxvf hadoop-3.3.0.tar.gz ``` 4. 配置Hadoop环境变量,在/etc/profile文件中添加以下内容: ``` export HADOOP_HOME=/usr/local/hadoop export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin ``` 然后执行以下命令使环境变量生效: ``` source /etc/profile ``` 5. 配置Hadoop分布式模式,修改以下配置文件: - /usr/local/hadoop/etc/hadoop/hadoop-env.sh ``` export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.292.b10-0.el7_9.x86_64 ``` - /usr/local/hadoop/etc/hadoop/core-site.xml ``` <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> ``` - /usr/local/hadoop/etc/hadoop/hdfs-site.xml ``` <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>/usr/local/hadoop/hadoop_data/hdfs/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/usr/local/hadoop/hadoop_data/hdfs/datanode</value> </property> </configuration> ``` - /usr/local/hadoop/etc/hadoop/mapred-site.xml ``` <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> ``` - /usr/local/hadoop/etc/hadoop/yarn-site.xml ``` <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> <property> <name>yarn.resourcemanager.hostname</name> <value>localhost</value> </property> <property> <name>yarn.nodemanager.resource.memory-mb</name> <value>1024</value> </property> <property> <name>yarn.nodemanager.resource.cpu-vcores</name> <value>1</value> </property> </configuration> ``` 6. 格式化Hadoop文件系统,执行以下命令: ``` hdfs namenode -format ``` 7. 启动Hadoop服务,执行以下命令: ``` start-all.sh ``` 8. 查看Hadoop服务状态,执行以下命令: ``` jps ``` 如果输出以下内容,则表示Hadoop服务已经启动成功: ``` 12345 NameNode 23456 DataNode 34567 ResourceManager 45678 NodeManager 56789 Jps ``` 9. 访问Hadoop Web界面,打开浏览器,输入以下地址: ``` http://localhost:9870/ ``` 如果能够正常访问,则表示Hadoop分布式安装成功。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值