Hadoop之伪分布式配置安装

        Hadoop支持本地模式、伪分布式模式、完全分布式模式3种安装模式。本地模式,在系统中下载Hadoop,默认情况下,它会被配置为一个独立的模式, 用于运行Java程序;伪分布式模式,这是在单台机器上的分布式模拟,这种模式对开发非常有用:完全分布式模式,又叫集群安装,Hadoop 安装在最少两台计算机的集群中。

安装VMware并安装CentOS:

CentOS下载https://www.centos.org/download/系统安装完成后需要进行如下配置

一、配置CentOS

1. 设置IP

选择设置

选择网络、选择设置

记住IPv4地址

IPv4中如下设置

 2. 修改主机名

hostnamectl set-hostname hadoop0

3. 使用vim编辑/etc/hosts

vim /etc/hosts

在最后一行添加IP hadoop0

如图:

4. 关闭防火墙

systemctl stop firewalld.service 

systemctl disable firewalld.service 

 5. 禁用selinux

使用vim编辑/etc/selinux/config

vim /etc/selinux/config

将SELINUX=enforcing改为SELINUX=disabled

6. 设置SSH免密登陆

cd /root/.ssh

rm -rf *

使用ssh-keygen -t dsa命令生成密码,之后使用回车确认配置。

ssh-keygen -t dsa

将生成的id_dsa.pub复制到指定的密钥目录authorized_keys中。

cat id_dsa.pub >>authorized_keys


如果出现没有.ssh目录

登录localhost并输入密码就会生成

ssh localhost


 7. 重启CentOS

reboot

二、Hadoop伪分布式安装

1. 下载Hadoop3.0.0并解压

Hadoop3.0.0下载http://archive.apache.org/dist/hadoop/core/hadoop-3.0.0/在CentOS中解压文件

tar -xvf hadoop-3.0.0.tar.gz

2. 配置它的环境变量

mv hadoop-3.0.0 hadoop

将Hadoop安装目录配置到/etc/profile的PATH环境变量

3. 使用source命令执行一次才能生效

source /etc/profile

4. 配置hadoop-env.sh

修改其中JAVA_HOME为本机的

5. 配置core-site.xml

<property>
    <name>fs.defaultFS</name>
    <value>hdfs://hadoop0:9000/</value>
    <description>NameNode URI</description>
</property>

6. 配置hdfs-site.xml

<property>
    <name>dfs.datanode.data.dir</name>
    <value>file:///usr/local/hadoop/data/datanode</value>
</property>
<property>
    <name>dfs.namenode.name.dir</name>
    <value>file:///usr/local/hadoop/data/namenode</value>
</property>
<property>
    <name>dfs.namenode.http-address</name>
    <value>hadoop0:50070</value>
</property>
<property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>hadoop0:50090</value>
</property>

7. 配置yarn-site.xml

<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>
<property>
    <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
    <value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
    <name>yarn.resourcemanager.resource-tracker.address</name>
    <value>hadoop0:8025</value>
</property>
<property>
    <name>yarn.resourcemanager.scheduler.address</name>
    <value>hadoop0:8030</value>
</property>
<property>
    <name>yarn.resourcemanager.address</name>
    <value>hadoop0:8050</value>
</property>

完成以上操作即可配置完成。

Hadoop验证

启动之前需要格式化,启动后开查看进程信息,浏览文件,验证是否能正常运行。

格式化命令:

hadoop namenode -format

如果没有报错则格式化成功

启动Hadoop

start-all.sh

若果没有报错则正常启动了

jps命令可查看进程信息

浏览文件

hadoop fs -ls /

浏览器中访问

http://本机IP:50070

结果如图:

个人学习,当做笔记记录。有误还望指出,仅供参考!

  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
分布式安装是在单台机器上模拟分布式安装方式,适用于学习和测试Hadoop的初学者。以下是分布式安装的步骤: 1. 首先,需要下载Hadoop安装包,并解压到本地的某个目录中。 2. 修改Hadoop配置文件,主要包括以下几个文件: - core-site.xml:配置Hadoop的核心参数,如HDFS的名称节点地址、RPC端口等。 - hdfs-site.xml:配置HDFS的相关参数,如数据块大小、副本数量等。 - mapred-site.xml:配置MapReduce的相关参数,如JobTracker地址、TaskTracker数量等。 - yarn-site.xml:配置YARN的相关参数,如NodeManager地址、ResourceManager地址等。 3. 接着,需要创建Hadoop的数据目录和日志目录,并修改它们的权限: - mkdir -p /home/hadoop/data/hdfs/namenode - mkdir -p /home/hadoop/data/hdfs/datanode - mkdir -p /home/hadoop/logs/hdfs - chmod -R 777 /home/hadoop/data /home/hadoop/logs 4. 启动Hadoop的服务: - 启动HDFS:hadoop namenode -format && start-all.sh - 启动YARN:start-yarn.sh 5. 确认Hadoop的服务已经启动成功: - 使用jps命令查看Hadoop的进程:jps - 访问Hadoop的Web界面:http://localhost:50070/(HDFS)、http://localhost:8088/(YARN) 以上就是Hadoop分布式安装的步骤。需要注意的是,分布式安装只是为了模拟分布式环境,不能支持真正的分布式计算。如果需要在多台机器上运行Hadoop集群,需要进行完整的分布式安装

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

神奇的布欧

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值