【Linux】文件互传scp/rsync/xsync分发脚本

集群文件同步方法

最新推荐文章于 2023-11-06 10:07:38 发布

hancoder

最新推荐文章于 2023-11-06 10:07:38 发布

阅读量616

点赞数

CC 4.0 BY-SA版权

分类专栏： linux与服务器文章标签： linux hadoop big data

blog.csdn.net/hancoder 可以打赏后索要离线md文件，打赏码在谷粒笔记的文尾。博主目前就职于阿里云，有需要可内推

本文链接：https://blog.csdn.net/hancoder/article/details/113172109

linux与服务器专栏收录该内容

11 篇文章

订阅专栏

本文介绍在集群环境中如何通过scp、rsync及自定义脚本xsync实现高效文件同步。scp适用于安全拷贝文件，rsync则更适用于快速同步，特别在处理大量文件时优势明显。xsync脚本实现了自动化文件分发。

一般性的文件使用MobaXterm软件直接拖拽即可，而服务器没有界面等问题可以采用命令的方式传输
本文的内容是在集群中比较常用，由其是集群同步

\1. scp(secure copy)安全拷贝

scp，linux命令，可以实现服务器与服务器之间的数据拷贝。（from server1 to server2）

语法：把本服务器的文件传到其他服务器中

scp   -r  源文件  目标文件   

scp -r $pdir/$fname   $user@hadoop$host:$pdir/$fname
scp -r /opt/module root@hadoop102:/opt/module

注意：
如果涉及到软连接ln，scp会进行拷贝真正的文件，而不是软连接。会很耗时且占用内存
解决软连接的问题是先打包文件再进行scp。
tar zcvf  test.tar.gz  test  # 打包test文件夹
tar zxvf test.tar.gz # 解压
# 为什么压缩包可以解决软连接的问题：
# 个人的想法是软连接建立时如果是按相对路径建立的ln -s test/1.txt 2，那么压缩解压后仍能保持相对路径
# 如果ln -s软连接时写的是绝对路径ln -s /home/ouc/test/1.txt 2，那么压缩拷贝到别处/etc后解压，点击解压后的2，打开的还是home下的 。 这个问题个人验证过了
# 所以说，我们用打包解决scp的软连接问题是可以的，因为github程序的软连接一般都是相对路径
少数情况下，如果ln软连接的是内核之类的或者是集群环境，可以考虑使用rsync -l
# 个人推测rsync拷贝完也是按照建立路径的规则查找的

r：代表递归
源文件/目标文件：格式如下 用户@主机名:目录/文件
user要用对应目录的写权限

使用：

#（a）在hadoop101上，将hadoop101中/opt/module目录下的软件拷贝到hadoop102上。
[atguigu@hadoop101 /]$ scp -r /opt/module root@hadoop102:/opt/module

#（b）在hadoop103上，将hadoop101服务器上的/opt/module目录下的软件拷贝到hadoop103上。
[atguigu@hadoop103 opt]$sudo scp -r atguigu@hadoop101:/opt/module root@hadoop103:/opt/module

#（c）在hadoop103上操作将hadoop101中/opt/module目录下的软件拷贝到hadoop104上。
[atguigu@hadoop103 opt]$ scp -r atguigu@hadoop101:/opt/module root@hadoop104:/opt/module

注意：拷贝过来的/opt/module目录，别忘了在hadoop102、hadoop103、hadoop104上修改所有文件的，所有者和所有者组。sudo chown atguigu:atguigu -R /opt/module

#（d）将hadoop101中/etc/profile文件拷贝到hadoop102的/etc/profile上。
[atguigu@hadoop101 ~]$ sudo scp /etc/profile root@hadoop102:/etc/profile

#（e）将hadoop101中/etc/profile文件拷贝到hadoop103的/etc/profile上。
[atguigu@hadoop101 ~]$ sudo scp /etc/profile root@hadoop103:/etc/profile

#（f）将hadoop101中/etc/profile文件拷贝到hadoop104的/etc/profile上。
[atguigu@hadoop101 ~]$ sudo scp /etc/profile root@hadoop104:/etc/profile

注意：拷贝过来的配置文件别忘了source一下/etc/profile，。

\2. rsync 远程同步工具

rsync主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点。

rsync和scp区别：用rsync做文件的复制要比scp的速度快，rsync只对差异文件做更新。scp是把所有文件都复制过去。

语法：

rsync   -rvl    $pdir/$fname        $user@hadoop$host:$pdir/$fname

说明：
rsync -选项  源   目的
#把hadoop101机器上的/opt/software目录同步到hadoop102服务器的root用户下的/opt/目录
[atguigu@hadoop101 opt]$ rsync -rvl /opt/software/ root@hadoop102:/opt/software

选项：r：递归。v：显示复制过程。l：拷贝符号链接
路径格式与scp相同：目的用户@主机:目的路径/名称

\3. xsync集群分发脚本

（1）需求：循环复制文件到所有节点的相同目录下。

说明：在/home/atguigu/bin这个目录下

（3）脚本实现

#（a）在/home/atguigu目录下创建bin目录，这个目录下存放的脚本，atguigu用户可以在系统任何地方直接执行。并在bin目录下xsync创建文件，文件内容如下：
[atguigu@hadoop102 ~]$ mkdir bin
[atguigu@hadoop102 ~]$ cd bin/
[atguigu@hadoop102 bin]$ touch xsync
[atguigu@hadoop102 bin]$ vi xsync

#!/bin/bash

# \`代表执行命令；$#代表取参数个数 $1代表取第一个参数  $p代表取变量内容
echo ======args==================
#1 获取输入参数个数，如果没有参数，直接退出
pcount=$#
if((pcount==0)); then
  echo no args;
  exit;
fi
#2 获取文件名称
p1=$1
fname=`basename $p1`
echo filename=$fname
#3 获取上级目录的绝对路径
pdir=`cd -P $(dirname $p1); pwd`
echo pdir=$pdir
#4 获取当前用户名称
user=`whoami`
echo ------start------------------------------
#5 循环
for((host=1; host<4; host++)); do
   echo --------------== hadoop$host ==------------------
   rsync -rvl $pdir/$fname $user@hadoop$host:$pdir
   # 复制输入的文件名称 到 目标主机的同级目录下
done
echo ------over...----------------------------
#文件修改结束


#（b）修改脚本 xsync 具有执行权限
[atguigu@hadoop102 bin]$ chmod 777 xsync

#（c）调用脚本形式：xsync 文件名称
[atguigu@hadoop102 bin]$ xsync /home/atguigu/bin
# 作用：将/home/atguigu/bin

注意：如果将xsync放到/home/atguigu/bin目录下仍然不能实现全局使用，可以将xsync移动到/usr/local/bin目录下。