Rsync

本文详细介绍了Rsync工具的使用,包括其特性、同步选项以及如何与inotify结合实现文件变化实时同步。rsync+inotify通过监控文件系统变化触发rsync同步,提高了效率。同时,文章还提到了rsync+sersync,它是基于inotify的增强版,记录具体变化文件,确保高效、准确的同步。最后,文中展示了设置rsync+inotify的步骤和脚本,以及sersync的同步过程。
摘要由CSDN通过智能技术生成

Rsync

rsync 简介

Rsync(remote synchronize)是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件,也可以使用 Rsync 同步本地硬盘中的不同目录。

Rsync 是用于取代rcp的一个工具,Rsync使用所谓的 “Rsync 算法” 来使本地和远程两个主机之间的文件达到同步,这个算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度相当快。您可以参考 How Rsync Works A Practical Overview 进一步了解 rsync 的运作机制。

Rsync支持大多数的类Unix系统,无论是Linux、Solaris还是BSD上都经过了良好的测试。此外,它在windows平台下也有相应的版本,比较知名的有cwRsync和Sync2NAS。

Rsync 的初始作者是 Andrew Tridgell 和 Paul Mackerras,它当前由 http://rsync.samba.org维护。

Rsync的基本特点如下:

1.可以镜像保存整个目录树和文件系统;

2. 可以很容易做到保持原来文件的权限、时间、软硬链接等;

3. 无须特殊权限即可安装;

4. 优化的流程,文件传输效率高;

5. 可以使用rcp、ssh等方式来传输文件,当然也可以通过直接的socket连接;

6. 支持匿名传输,以方便进行网站镜像。

在使用 rsync 进行远程同步时,可以使用两种方式:远程 Shell 方式(建议使用 ssh,用户验证由 ssh 负责)和 C/S 方式(即客户连接远程 rsync 服务器,用户验证由 rsync 服务器负责)。

无论本地同步目录还是远程同步数据,首次运行时将会把全部文件拷贝一次,以后再运行时将只拷贝有变化的文件(对于新文件)或文件的变化部分(对于原有文件)。

rsync 在首次复制时没有速度优势,速度不如 tar,因此当数据量很大时您可以考虑先使用 tar 进行首次复制,然后再使用 rsync 进行数据同步。

//rsync常用选项:
    -a, --archive       //归档
    -v, --verbose       //详细模式
    -q, --quiet         //省略模式
    -r, --recursive     //递归
    -p, --perms         //保持原有的权限属性
    -z, --compress      //在传输时压缩,节省带宽,加快传输速度
    --delete            //在源服务器上做的删除操作也会在目标服务器上同步	#--delete使针对目录同步操作,如果只是同步单个文件,--delete没有效果。

rsync+inotify

传统的cp或者tar备份,都是全量备份,并且并没有实时更改的能力。而rsync具有安全性高,备份迅速,支持增量备份等,通过rsync可以解决对实时性要求不高的数据备份需求,例如定期的备份文件服务器数据到远端服务器,对本地磁盘定期做数据镜像等。

随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出的更好的要求,rsync在高端业务系统中也逐渐暴露出了很多不足,首先,rsync同步数据时,需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了百万甚至千万量级,扫描所有文件将是非常耗时的。而且正在发生变化的往往是其中很少的一部分,这是非常低效的方式。其次,rsync不能实时的去监测、同步数据,虽然它可以通过linux守护进程的方式进行触发同步,但是两次触发动作一定会有时间差,这样就导致了服务端和客户端数据可能出现不一致,无法在应用故障时完全的恢复数据。基于以上原因,rsync+inotify组合出现了!

inotify是一个时间监控机制,linux内核从2.6.13起,加入了inotify支持,通过inotify可以监控文件系统中添加、删除、修改、移动等各种细微时间,利用这个内核接口,第三方软件就可以监控文件系统下文件的各种变化情况。

而rsync+inotify就是利用了rsync的触发式文件同步,而inotify可以监控文件系统的各种变化,当文件变化时inotify就会触发rsync同步。

rsync+inotify部署

在虚拟环境中部署:

目标服务端:也就是接收端

首先关闭防火墙与SElinux

[root@localhost ~]# systemctl stop firewalld
[root@localhost ~]# systemctl disable firewalld
[root@localhost ~]# getenforce
Disabled
[root@localhost ~]# setenforce 0
setenforce: SELinux is disabled
[root@localhost ~]# sed -ri 's/^(SELINUX=).*/\1disabled/g' /etc/sysconfig/selinux
#这些提示都是因为这台虚拟机之前已经完成过这种操作了。

安装rsync服务端软件

[root@localhost ~]# yum -y install rsync*

#设置rsyncd.conf配置文件
[root@localhost ~]#  cat >> /etc/rsyncd.conf <<EOF
> log file = /var/log/rsyncd.log
> pidfile = /var/run/rsyncd.pid
> lock file = /var/run/rsync.lock
> secrets file = /etc/rsync.pass
> [etc_from_client]     # 自定义同步名称
> path = /tmp/          # rsync服务端数据存放路径,客户端的数据将同步至此目录
> comment = sync etc from client
> uid = root        # 设置rsync运行权限为root
> gid = root        # 设置rsync运行权限为root
> port = 873        # 默认端口
> ignore errors     # 表示出现错误忽略错误
> use chroot = no       # 默认为true,修改为no,增加对目录文件软连接的备份
> read only = no    # 设置rsync服务端为读写权限
> list = no     # 不显示rsync服务端资源列表
> max connections = 200     # 最大连接数
> timeout = 600     # 设置超时时间
> auth users = admin        # 执行数据同步的用户名,可以设置多个,用英文状态下逗号隔开
> hosts allow = 192.168.245.128   # 允许进行数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
> EOF

创建上面定义过的用户认证文件

[root@localhost ~]# echo 'admin:123' > /etc/rsyncd.pass
[root@localhost ~]# cat /etc/rsyncd.pass
admin:123

设置文件权限

[root@localhost ~]# chmod 600 /etc/rsync*
[root@localhost ~]# ll /etc/rsync*
-rw------- 1 root root 1140 Sep 22 21:15 /etc/rsyncd.conf
-rw------- 1 root root   10 Sep 22 21:16 /etc/rsyncd.pass

启动rsync服务并设置开机自启动

[root@localhost ~]# systemctl start rsyncd
[root@localhost ~]# systemctl enable rsyncd
Created symlink /etc/systemd/system/multi-user.target.wants/rsyncd.service → /usr/lib/systemd/system/rsyncd.service.
[root@localhost ~]# ss -antl
State     Recv-Q    Send-Q        Local Address:Port          Peer Address:Port    Process    
---------
LISTEN    0         5                   0.0.0.0:873                0.0.0.0:*  
--------

在源服务器上做以下操作:

首先关闭防火墙与SElinux

[root@localhost ~]# systemctl stop firewalld
[root@localhost ~]# systemctl disable firewalld
[root@localhost ~]# getenforce
Disabled
[root@localhost ~]# setenforce 0
setenforce: SELinux is disabled
[root@localhost ~]# sed -ri 's/^(SELINUX=).*/\1disabled/g' /etc/sysconfig/selinux
#这些提示都是因为这台虚拟机之前已经完成过这种操作了。

下载新repo 到/etc/yum.repos.d/

下载新repo 到/etc/yum.repos.d/
epel(RHEL 8)
1)安装 epel 配置包

yum install -y https://mirrors.aliyun.com/epel/epel-release-latest-8.noarch.rpm
2)将 repo 配置中的地址替换为阿里云镜像站地址

sed -i 's|^#baseurl=https://download.example/pub|baseurl=https://mirrors.aliyun.com|' /etc/yum.repos.d/epel*

sed -i 's|^metalink|#metalink|' /etc/yum.repos.d/epel*

安装rsync服务端软件,只需要安装,不要启动,不需要配置

[root@localhost ~]# yum -y install rsync

创建认证密码文件

[root@localhost ~]# echo '123' > /etc/rsync.pass
[root@localhost ~]# cat /etc/rsync.pass
123
[root@localhost ~]# chmod 600 /etc/rsync.pass
[root@localhost ~]# 
在源服务器上创建测试目录,然后在源服务器运行以下命令

在源服务器上创建测试目录,然后在源服务器运行以下命令

[root@localhost ~]# mkdir -pv /root/etc/george
mkdir: created directory '/root/etc'
mkdir: created directory '/root/et
[root@localhost ~]# rsync -avH --port 873 --progress --delete /root/etc/ admin@192.168.183.138::etc_from_client --password-file=/etc/rsync.pass
sending incremental file list
deleting vmware-root_901-3988228452/
./
george/

sent 79 bytes  received 58 bytes  91.33 bytes/sec
total size is 0  speedup is 0.00
[root@localhost ~]# 


//运行完成后,在目标服务器上查看,在/tmp目录下有test目录,说明数据同步成功
[root@client ~]# ls /tmp/
george


//安装inotify-tools工具,实时触发rsync进行同步
//查看服务器内核是否支持inotify
[root@localhost ~]# ll /proc/sys/fs/inotify/
total 0
-rw-r--r--. 1 root root 0 Sep 22 18:30 max_queued_events
-rw-r--r--. 1 root root 0 Sep 22 18:30 max_user_instances
-rw-r--r--. 1 root root 0 Sep 22 18:30 max_user_watches
[root@localhost ~]# 
//如果有这三个max开头的文件则表示服务器内核支持inotify

//安装inotify-tools
[root@localhost ~]# dnf -y install inotify-tools

//写同步脚本,让脚本自动去检测我们制定的目录下文件发生的变化,然后再执行rsync的命令把它同步到目标服务器
[root@localhost ~]# mkdir /scripts
[root@localhost ~]# touch /scripts/inotify.sh
[root@localhost ~]# chmod 755 /scripts/inotify.sh
[root@localhost ~]# ll /scripts/inotify.sh
-rwxr-xr-x. 1 root root 0 Sep 22 18:33 /scripts/inotify.sh
[root@localhost ~]# vi /scripts/inotify.sh
host=192.168.183.138	//目标服务器的ip(备份服务器)
src=/etc	//在源服务器上所要监控的备份目录(此处可以自定义,但是要保证存在)      
des=etc_from_client 	//自定义的模块名,需要与目标服务器上定义的同步名称一致    
password=/etc/rsync.pass   	 //执行数据同步的密码文件 
user=admin     //执行数据同步的用户名
inotifywait=/usr/bin/inotifywait

$inotifywait -mrq --timefmt '%Y%m%d %H:%M' --format '%T %w%f%e' -e modify,delete,create,attrib $src \
| while read files;do
    rsync -avzP --delete  --timeout=100 --password-file=${password} $src $user@$host::$des
    echo "${files} was rsynced" >>/tmp/rsync.log 2>&1
done

//启动脚本
[root@localhost ~]# /scripts/inotify.sh &
[1] 101557
[root@localhost ~]# ps -ef | grep inotify
root      101558  101557  0 18:37 pts/0    00:00:00 /usr/bin/inotifywait -mrq --timefmt %Y%m%d %H:%M --format %T %w%f%e -e modify,delete,create,attrib /etc
root      101923    3154  0 18:37 pts/0    00:00:00 grep --color=auto inotify
[root@localhost ~]# 


//在源服务器上生成一个新文件
[root@server etc]# echo 'hello world!' > /etc/opt/george
[root@server etc]# tail /tmp/rsync.log
20220922 18:42 /etc/opt/georgeCREATE was rsynced
20220922 18:42 /etc/opt/georgeMODIFY was rsynced

设置脚本开机自启

[root@server ~]# chmod +x /etc/rc.d/rc.local
[root@server ~]# ll /etc/rc.d/rc.local
-rwxr-xr-x. 1 root root 474 Jan 28  2022 /etc/rc.d/rc.local
[root@server ~]# echo 'nohup /bin/bash /scripts/inotify.sh' >> /etc/rc.d/rc.local
[root@server ~]# tail /etc/rc.d/rc.local
#
# In contrast to previous versions due to parallel execution during boot
# this script will NOT be run after all other services.
#
# Please note that you must run 'chmod +x /etc/rc.d/rc.local' to ensure
# that this script will be executed during boot.

touch /var/lock/subsys/local

nohup /bin/bash /scripts/inotify.sh

查看目标服务器是否将新生成的文件自动传上去了
[root@localhost tmp]# pwd
/tmp
[root@localhost tmp]# ls
etc  george

rsync+sersync

相较于rsync+inotify,rsync+sersync在功能上并没有太大区别。

为什么使用rsync+sersync

  • sersync是基于inotify开发的,类似inotify-tools的工具
  • sersync可以记录下被监听的目录中发生的变化的(增删改)具体某一个文件或者某一个目录的名字,然后使用rsync差异同步
  • 因为服务异常导致的同步失败有记录,便于恢复,确保高可用

inotify与sersync区别

  • inotify只能记录下被监听的目录发生了变化,并没有把具体是哪个文件或者哪个目录发生了变化记录下来
  • rsync在同步的时候,并不具体知道是哪个文件或目录发生了变化,每次都是对整个目录进行同步,当数据量足够大的时候,同步整个目录非常浪费时间,效率也比较低
  • sersync可以记录被监听目录发生变化的具体某个文件或者目录的名字
  • rsync在同步时,只同步发生变化的文件或目录,每次发生变化的数据相对整个同步目录数据来说很小,rsync在遍历查找对比文件时,速度快,因此效率高。

同步过程:

  1. 在同步服务器上开启sersync服务,sersync负责监控配置路径中的文件系统事件变化;
  2. 调用rsync命令把更新的文件同步到目标服务器
  3. 需要在主服务器配置sersync,在同步目标服务器配置rsync server

同步过程原理

  1. 用户实时的向sersync服务器上写入更新文件数据

  2. 此时需要在同步主服务器上配置serync 服务

  3. 在另一台服务器开启rsync守护进程,以同步拉取来自sersync服务器上的数据

    通过rsync的守护进程服务后可以发现,实际上sersync就是监控本地数据写入或更新事件。然后调用rsync客户端的命令,将写入或更新事件对应的文件通过rsync推送到目标服务器

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值