Hadoop集群搭建(详细步骤)—完全分布式运行模式

本文详细介绍了Hadoop完全分布式集群的搭建过程,包括虚拟机准备、集群分发脚本xsync的编写、集群配置、SSH无密登录配置、集群测试和时间同步等关键步骤。通过实例和配置解析,帮助读者掌握Hadoop集群搭建的全过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分析:

1)准备3台客户机(关闭防火墙、静态ip、主机名称)
2)安装jdk
3)配置环境变量
4)安装hadoop
5)配置环境变量
6)配置集群
7)单点启动
8)配置ssh
9)群起并测试集群

一、虚拟机准备

详见:

Hadoop运行环境搭建(含Linux网络配置和系统管理操作)
https://blog.csdn.net/weixin_37838429/article/details/81569248

二、编写集群分发脚本xsync

1.scp:secure copy 安全拷贝

(1)scp定义:

scp可以实现服务器与服务器之间的数据拷贝。(from server1 to server2)

(2)举个栗子
 将hadoop101中/opt/module目录下的软件拷贝到hadoop102上。

[admin@hadoop101 /]$ scp -r /opt/module/*  admin@hadoop102:/opt/module
2.rsync

  rsync远程同步工具,主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点。
  rsync和scp区别:用rsync做文件的复制要比scp的速度快,rsync只对差异文件做更新。scp是把所有文件都复制过去。

(1)查看rsync使用说明

man rsync | more

(2)基本语法

rsync -rvl     $pdir/$fname         $user@hadoop$host:$pdir
#命令 命令参数 要拷贝的文件路径/名称   目的用户@主机:目的路径

(3)选项说明

选项 功能
-r 递归
-v 显示复制过程
-l 拷贝符号连接

(4)举个栗子
 把hadoop101机器上的/opt/software目录同步到hadoop102服务器的root用户下的/opt/目录

[admin@hadoop101 opt]$ rsync -rvl /opt/software/* hadoop102:/opt/software/
3.脚本需求分析:循环复制文件到所有节点的相同目录下(批处理循环拷贝)

(1)原始拷贝:

rsync  -rvl     /opt/module          root@hadoop103:/opt/

(2)期望脚本:

xsync 要同步的文件名称

(3)在/home/admin/bin这个目录下存放的脚本,admin用户可以在系统任何地方直接执行。

4.脚本实现

(1)在/home/admin目录下创建bin目录,并在bin目录下创建xsync文件,文件内容如下:

[admin@hadoop102 ~]$ mkdir bin
[admin@hadoop102 ~]$ cd bin/
[admin@hadoop102 bin]$ touch xsync
[admin@hadoop102 bin]$ vi xsync
#!/bin/bash
#1 获取输入参数个数,如果没有参数,直接退出
pcount=$#
if((pcount==0)); then
echo no args;
exit;
fi

#2 获取文件名称
p1=$1
fname=`basename $p1`
echo fname=$fname

#3 获取上级目录到绝对路径
pdir=`cd -P $(dirname $p1); pwd`
echo pdir=$pdir

#4 获取当前用户名称
user=`whoami`

#5 循环
for((host=103; host<105; host++)); do
        echo --------------------- hadoop$host ----------------
        rsync -rvl $pdir/$fname $user@hadoop$host:$pdir
done

(2)修改脚本 xsync 具有执行权限

[admin@hadoop102 bin]$ chmod 777 xsync

(3)调用脚本形式:xsync 文件名称

[admin@hadoop102 bin]$ xsync /home/admin/bin

三、集群配置

1.集群部署规划
hadoop102 hadoop103 hadoop104
HDFS NameNode
DataNode
DataNode SecondaryNameNode
DataNode
YARN NodeManager ResourceManager
NodeManager
NodeManager
2.配置集群

(1)核心配置文件
core-site.xml

[admin@hadoop102 hadoop]$ vi core-site.xml
<!-- 指定HDFS中NameNode的地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop102:9000</value>
    </proper
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值