基于Centos7的集群分发脚本xsync

最新推荐文章于 2024-06-19 14:55:43 发布

电光闪烁

最新推荐文章于 2024-06-19 14:55:43 发布

阅读量1.1k

点赞数 2

分类专栏： # 大数据环境搭建文章标签： centos rsync

本文链接：https://blog.csdn.net/yang_shibiao/article/details/123804496

版权

大数据环境搭建专栏收录该内容

35 篇文章 5 订阅

订阅专栏

本文详细介绍了Linux系统中用于文件安全拷贝的scp命令，以及远程文件同步工具rsync的使用。通过实例操作展示了如何在不同服务器间进行文件和目录的复制。此外，还分享了一个名为xsync的脚本，用于集群环境下的文件分发，实现了遍历所有节点并同步指定文件的功能。在使用这些工具前，需确保已配置好SSH无密登录，并安装了rsync服务。

摘要由CSDN通过智能技术生成

0. 相关文章链接

1. scp（secure copy）安全拷贝

0. 相关文章链接

大数据基础知识点文章汇总

1. scp（secure copy）安全拷贝

1）scp定义：

scp可以实现服务器与服务器之间的数据拷贝。（from server1 to server2）

2）基本语法：

scp -r $pdir/$fname $user@$host:$pdir/$fname
命令递归要拷贝的文件路径/名称目的地用户@主机:目的地路径/名称

3）案例实操前提：

在bigdata1、bigdata2、bigdata3 都已经创建好的/opt/module、/opt/software两个目录，并且已经把这两个目录修改为 root:root （root组和root用户）

chown root:root -R /opt/module

4）案例实操一：在bigdata1上，将bigdata1中/opt/module/jdk1.8.0_212目录拷贝到bigdata2上

scp -r /opt/module/jdk1.8.0_212  root@bigdata2:/opt/module

5）案例实操二：在bigdata2上，将bigdata1中/opt/module/hadoop-3.1.3目录拷贝到bigdata1上

scp -r root@bigdata1:/opt/module/hadoop-3.1.3 /opt/module/

6）案例实操三：在bigdata2上操作，将bigdata1中/opt/module目录下所有目录拷贝到bigdata3上

scp -r root@bigdata1:/opt/module/* root@bigdata3:/opt/module

2. rsync远程同步工具

rsync主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点。

rsync和scp区别：用rsync做文件的复制要比scp的速度快，rsync只对差异文件做更新。scp是把所有文件都复制过去。

2.1. 基本语法

rsync -av $pdir/$fname $user@$host:$pdir/$fname
命令选项参数要拷贝的文件路径/名称目的地用户@主机:目的地路径/名称

选项参数说明：

选项	功能
-a	归档拷贝
-v	显示复制过程

2.2. 实例操作

1）删除bigdata2中/opt/module/hadoop-3.1.3/wcinput

rm -rf wcinput/

2）同步bigdata1中的/opt/module/hadoop-3.1.3到bigdata2

rsync -av hadoop-3.1.3/ root@bigdata2:/opt/module/hadoop-3.1.3/

3. xsync集群分发脚本

主要目的：循环复制文件到所有节点的相同目录下

1）rsync命令原始拷贝：

rsync -av /opt/module root@bigdata2:/opt/

2）期望脚本：xsync要同步的文件名称

3）期望脚本在任何路径都能使用（脚本放在声明了全局环境变量的路径）

echo $PATH
/usr/java/jdk1.8.0_181/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin:/root/bin

4）在/root/bin目录下创建xsync文件，并在该文件中编写如下代码

vim xsync

#!/bin/bash

#1. 判断参数个数
if [ $# -lt 1 ]
then
    echo Not Enough Arguement!
    exit;
fi

#2. 遍历集群所有机器
for host in bigdata1 bigdata2 bigdata3
do
    echo ====================  $host  ====================
    #3. 遍历所有目录，挨个发送

    for file in $@
    do
        #4. 判断文件是否存在
        if [ -e $file ]
            then
                #5. 获取父目录
                pdir=$(cd -P $(dirname $file); pwd)

                #6. 获取当前文件的名称
                fname=$(basename $file)
                ssh $host "mkdir -p $pdir"
                rsync -av $pdir/$fname $host:$pdir
            else
                echo $file does not exists!
        fi
    done
done

5）修改脚本 xsync 具有执行权限

chmod +x xsync

6）测试脚本

注意：在测试之前需要在所有机器上安装 rsync 服务，安装命令如下

yum -y install rsync

# 如果还是不能使用，需要启动rsync服务
systemctl start rsyncd.service
systemctl enable rsyncd.service

# 检查是否已经成功启动
netstat -lnp|grep 873

注意：在测试之前要配置源机器到目标机器的免密登录，可以参考博主另一篇博客：基于Centos7的SSH无密登录配置

7）如有必要，可以将脚本复制到/bin中，以便全局调用（/root/bin下其实也可以全局调用）

cp xsync /bin/

注：其他相关文章链接由此进 -> 大数据基础知识点文章汇总

电光闪烁

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录