Hadoop伪分布式集群的搭建

前言:

在大数据和分布式计算领域,搭建伪分布式系统是一种常见的实验和开发方式。伪分布式系统,也称为模拟分布式系统或模拟集群,主要用于模拟真实的分布式环境,以便进行开发和测试。在搭建伪分布式系统之前,了解其目的和优势是至关重要的。

一、前期准备工作

准备工作一准备一台centOS6的虚拟机、一台Windows11的笔记本电脑
准备工作二准备好Hadoop3.x以上的压缩包
准备工作三准备好jdk8的压缩包


二、组网搭建

1.配置网络IP

   1.1.将虚拟机网络的连接改成自定义模式(VMnet8模式)

注:静态网络的配置在另外一篇博客里

   1.2.修改ifcfg-eth0网络配置

   1.3.重新启动网络服务

service network restart

   1.4.测试配置的IP、网关能否ping通

2.关闭防火墙

   2.1.临时关闭防火墙

       2.1.1.查看防火墙状态
service iptables status

   

       2.1.2.关闭防火墙
service iptables stop

   2.2.永久关闭防火墙

chkconfig iptables off

3.修改主机名

    3.1.临时修改主机名
hostname Master

注:这个根据自己的需求改!

   3.2.永久修改主机名
vim /etc/sysconfig/network

注:修改里面的hostname,其他的不要动!

4.绑定主机IP和主机名

vim /etc/hosts

到此,便完成了组网的搭建!


三、配置Hadoop伪分布式集群

注:创建普通用户去搭建!

   1.创建普通用户、配置免密登录

#创建hd普通用户
useradd hd

#修改其密码
passwd hd

#配置免密钥
ssh-keygen -t rsa

#切入.ssh目录下
cd .ssh/

#将公钥复制到公钥库
cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys

 

配置免密登录成功!

2.创建一个目录,用于管理上传的jdk和Hadoop压缩包

  • 注:根据自己的喜爱创建,不想创建也可以!

  • 进入创建的software目录下

  • 将jdk和Hadoop压缩包上传到该目录下

3.解压jdk和Hadoop、配置java、Hadoop环境变量

  • 解压

  • 配置环境变量
#配置用户环境变量
vim .bash_proile

#刷新环境变量
source .bash_profile

4.配置Hadoop集群所需的核心文件

  4.1.在software目录下创建hadooptmp目录

  • 用于存放初始化Hadoop时产生的数据

 4.2.在hadoop-env.sh文件中添加jdk安装路径

#切到该目录下
cd hadoop-3.3.0/etc/hadoop/

#编辑hadoop-env.sh
vim hadoop-env.sh

 4.3.配置core-site.xml文件

vim core-site.xml

 4.4.配置hdfs-site.xml文件

vim hdfs-site.xml

 4.5.配置mapred-site.xml文件

vim mapred-site.xml

 4.6.配置yarn-site.xml文件

vim yarn-site.xml

4.7.配置works文件

vim works

5.格式化namenode

hadoop namenode -format

6.启动Hadoop伪分布式集群

start-all.sh

  • 查看集群9870端口

  • 查看集群8088端口

 到此,Hadoop伪分布式集群就搭建成功了!

  • 18
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值