Rsync
rsync 简介
Rsync(remote synchronize)是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件,也可以使用 Rsync 同步本地硬盘中的不同目录。
Rsync 是用于取代rcp的一个工具,Rsync使用所谓的 “Rsync 算法” 来使本地和远程两个主机之间的文件达到同步,这个算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度相当快。您可以参考 How Rsync Works A Practical Overview 进一步了解 rsync 的运作机制。
Rsync支持大多数的类Unix系统,无论是Linux、Solaris还是BSD上都经过了良好的测试。此外,它在windows平台下也有相应的版本,比较知名的有cwRsync和Sync2NAS。
Rsync 的初始作者是 Andrew Tridgell 和 Paul Mackerras,它当前由 http://rsync.samba.org维护。
Rsync的基本特点如下:
1.可以镜像保存整个目录树和文件系统;
2. 可以很容易做到保持原来文件的权限、时间、软硬链接等;
3. 无须特殊权限即可安装;
4. 优化的流程,文件传输效率高;
5. 可以使用rcp、ssh等方式来传输文件,当然也可以通过直接的socket连接;
6. 支持匿名传输,以方便进行网站镜像。
在使用 rsync 进行远程同步时,可以使用两种方式:远程 Shell 方式(建议使用 ssh,用户验证由 ssh 负责)和 C/S 方式(即客户连接远程 rsync 服务器,用户验证由 rsync 服务器负责)。
无论本地同步目录还是远程同步数据,首次运行时将会把全部文件拷贝一次,以后再运行时将只拷贝有变化的文件(对于新文件)或文件的变化部分(对于原有文件)。
rsync 在首次复制时没有速度优势,速度不如 tar,因此当数据量很大时您可以考虑先使用 tar 进行首次复制,然后再使用 rsync 进行数据同步。
//rsync常用选项:
-a, --archive //归档
-v, --verbose //详细模式
-q, --quiet //省略模式
-r, --recursive //递归
-p, --perms //保持原有的权限属性
-z, --compress //在传输时压缩,节省带宽,加快传输速度
--delete //在源服务器上做的删除操作也会在目标服务器上同步 #--delete使针对目录同步操作,如果只是同步单个文件,--delete没有效果。
rsync+inotify
传统的cp或者tar备份,都是全量备份,并且并没有实时更改的能力。而rsync具有安全性高,备份迅速,支持增量备份等,通过rsync可以解决对实时性要求不高的数据备份需求,例如定期的备份文件服务器数据到远端服务器,对本地磁盘定期做数据镜像等。
随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出的更好的要求,rsync
在高端业务系统中也逐渐暴露出了很多不足,首先,rsync
同步数据时,需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了百万甚至千万量级,扫描所有文件将是非常耗时的。而且正在发生变化的往往是其中很少的一部分,这是非常低效的方式。其次,rsync
不能实时的去监测、同步数据,虽然它可以通过linux
守护进程的方式进行触发同步,但是两次触发动作一定会有时间差,这样就导致了服务端和客户端数据可能出现不一致,无法在应用故障时完全的恢复数据。基于以上原因,rsync
+inotify
组合出现了!
inotify是一个时间监控机制,linux内核从2.6.13起,加入了inotify支持,通过inotify可以监控文件系统中添加、删除、修改、移动等各种细微时间,利用这个内核接口,第三方软件就可以监控文件系统下文件的各种变化情况。
而rsync+inotify就是利用了rsync的触发式文件同步,而inotify可以监控文件系统的各种变化,当文件变化时inotify就会触发rsync同步。
rsync+inotify部署
在虚拟环境中部署:
目标服务端:也就是接收端
首先关闭防火墙与SElinux
[root@localhost ~]# systemctl stop firewalld
[root@localhost ~]# systemctl disable firewalld
[root@localhost ~]# getenforce
Disabled
[root@localhost ~]# setenforce 0
setenforce: SELinux is disabled
[root@localhost ~]# sed -ri 's/^(SELINUX=).*/\1disabled/g' /etc/sysconfig/selinux
#这些提示都是因为这台虚拟机之前已经完成过这种操作了。
安装rsync服务端软件
[root@localhost ~]# yum -y install rsync*
#设置rsyncd.conf配置文件
[root@localhost ~]# cat >> /etc/rsyncd.conf <<EOF
> log file = /var/log/rsyncd.log
> pidfile = /var/run/rsyncd.pid
> lock file = /var/run/rsync.lock
> secrets file = /etc/rsync.pass
> [etc_from_client] # 自定义同步名称
> path = /tmp/ # rsync服务端数据存放路径,客户端的数据将同步至此目录
> comment = sync etc from client
> uid = root # 设置rsync运行权限为root
> gid = root # 设置rsync运行权限为root
> port = 873 # 默认端口
> ignore errors # 表示出现错误忽略错误
> use chroot = no # 默认为true,修改为no,增加对目录文件软连接的备份
> read only = no # 设置rsync服务端为读写权限
> list = no # 不显示rsync服务端资源列表
> max connections = 200 # 最大连接数
> timeout = 600 # 设置超时时间
> auth users = admin # 执行数据同步的用户名,可以设置多个,用英文状态下逗号隔开
> hosts allow = 192.168.245.128 # 允许进行数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
> EOF
创建上面定义过的用户认证文件
[root@localhost ~]# echo 'admin:123' > /etc/rsyncd.pass
[root@localhost ~]# cat /etc/rsyncd.pass
admin:123
设置文件权限
[root@localhost ~]# chmod 600 /etc/rsync*
[root@localhost ~]# ll /etc/rsync*
-rw------- 1 root root 1140 Sep 22 21:15 /etc/rsyncd.conf
-rw------- 1 root root 10 Sep 22 21:16 /etc/rsyncd.pass
启动rsync服务并设置开机自启动
[root@localhost ~]# systemctl start rsyncd
[root@localhost ~]# systemctl enable rsyncd
Created symlink /etc/systemd/system/multi-user.target.wants/rsyncd.service → /usr/lib/systemd/system/rsyncd.service.
[root@localhost ~]# ss -antl
State Recv-Q Send-Q Local Address:Port Peer Address:Port Process
---------
LISTEN 0 5 0.0.0.0:873 0.0.0.0:*
--------
在源服务器上做以下操作:
首先关闭防火墙与SElinux
[root@localhost ~]# systemctl stop firewalld
[root@localhost ~]# systemctl disable firewalld
[root@localhost ~]# getenforce
Disabled
[root@localhost ~]# setenforce 0
setenforce: SELinux is disabled
[root@localhost ~]# sed -ri 's/^(SELINUX=).*/\1disabled/g' /etc/sysconfig/selinux
#这些提示都是因为这台虚拟机之前已经完成过这种操作了。
下载新repo 到/etc/yum.repos.d/
下载新repo 到/etc/yum.repos.d/
epel(RHEL 8)
1)安装 epel 配置包
yum install -y https://mirrors.aliyun.com/epel/epel-release-latest-8.noarch.rpm
2)将 repo 配置中的地址替换为阿里云镜像站地址
sed -i 's|^#baseurl=https://download.example/pub|baseurl=https://mirrors.aliyun.com|' /etc/yum.repos.d/epel*
sed -i 's|^metalink|#metalink|' /etc/yum.repos.d/epel*
安装rsync服务端软件,只需要安装,不要启动,不需要配置
[root@localhost ~]# yum -y install rsync
创建认证密码文件
[root@localhost ~]# echo '123' > /etc/rsync.pass
[root@localhost ~]# cat /etc/rsync.pass
123
[root@localhost ~]# chmod 600 /etc/rsync.pass
[root@localhost ~]#
在源服务器上创建测试目录,然后在源服务器运行以下命令
在源服务器上创建测试目录,然后在源服务器运行以下命令
[root@localhost ~]# mkdir -pv /root/etc/george
mkdir: created directory '/root/etc'
mkdir: created directory '/root/et
[root@localhost ~]# rsync -avH --port 873 --progress --delete /root/etc/ admin@192.168.183.138::etc_from_client --password-file=/etc/rsync.pass
sending incremental file list
deleting vmware-root_901-3988228452/
./
george/
sent 79 bytes received 58 bytes 91.33 bytes/sec
total size is 0 speedup is 0.00
[root@localhost ~]#
//运行完成后,在目标服务器上查看,在/tmp目录下有test目录,说明数据同步成功
[root@client ~]# ls /tmp/
george
//安装inotify-tools工具,实时触发rsync进行同步
//查看服务器内核是否支持inotify
[root@localhost ~]# ll /proc/sys/fs/inotify/
total 0
-rw-r--r--. 1 root root 0 Sep 22 18:30 max_queued_events
-rw-r--r--. 1 root root 0 Sep 22 18:30 max_user_instances
-rw-r--r--. 1 root root 0 Sep 22 18:30 max_user_watches
[root@localhost ~]#
//如果有这三个max开头的文件则表示服务器内核支持inotify
//安装inotify-tools
[root@localhost ~]# dnf -y install inotify-tools
//写同步脚本,让脚本自动去检测我们制定的目录下文件发生的变化,然后再执行rsync的命令把它同步到目标服务器
[root@localhost ~]# mkdir /scripts
[root@localhost ~]# touch /scripts/inotify.sh
[root@localhost ~]# chmod 755 /scripts/inotify.sh
[root@localhost ~]# ll /scripts/inotify.sh
-rwxr-xr-x. 1 root root 0 Sep 22 18:33 /scripts/inotify.sh
[root@localhost ~]# vi /scripts/inotify.sh
host=192.168.183.138 //目标服务器的ip(备份服务器)
src=/etc //在源服务器上所要监控的备份目录(此处可以自定义,但是要保证存在)
des=etc_from_client //自定义的模块名,需要与目标服务器上定义的同步名称一致
password=/etc/rsync.pass //执行数据同步的密码文件
user=admin //执行数据同步的用户名
inotifywait=/usr/bin/inotifywait
$inotifywait -mrq --timefmt '%Y%m%d %H:%M' --format '%T %w%f%e' -e modify,delete,create,attrib $src \
| while read files;do
rsync -avzP --delete --timeout=100 --password-file=${password} $src $user@$host::$des
echo "${files} was rsynced" >>/tmp/rsync.log 2>&1
done
//启动脚本
[root@localhost ~]# /scripts/inotify.sh &
[1] 101557
[root@localhost ~]# ps -ef | grep inotify
root 101558 101557 0 18:37 pts/0 00:00:00 /usr/bin/inotifywait -mrq --timefmt %Y%m%d %H:%M --format %T %w%f%e -e modify,delete,create,attrib /etc
root 101923 3154 0 18:37 pts/0 00:00:00 grep --color=auto inotify
[root@localhost ~]#
//在源服务器上生成一个新文件
[root@server etc]# echo 'hello world!' > /etc/opt/george
[root@server etc]# tail /tmp/rsync.log
20220922 18:42 /etc/opt/georgeCREATE was rsynced
20220922 18:42 /etc/opt/georgeMODIFY was rsynced
设置脚本开机自启
[root@server ~]# chmod +x /etc/rc.d/rc.local
[root@server ~]# ll /etc/rc.d/rc.local
-rwxr-xr-x. 1 root root 474 Jan 28 2022 /etc/rc.d/rc.local
[root@server ~]# echo 'nohup /bin/bash /scripts/inotify.sh' >> /etc/rc.d/rc.local
[root@server ~]# tail /etc/rc.d/rc.local
#
# In contrast to previous versions due to parallel execution during boot
# this script will NOT be run after all other services.
#
# Please note that you must run 'chmod +x /etc/rc.d/rc.local' to ensure
# that this script will be executed during boot.
touch /var/lock/subsys/local
nohup /bin/bash /scripts/inotify.sh
查看目标服务器是否将新生成的文件自动传上去了
[root@localhost tmp]# pwd
/tmp
[root@localhost tmp]# ls
etc george
rsync+sersync
相较于rsync+inotify,rsync+sersync在功能上并没有太大区别。
为什么使用rsync+sersync
- sersync是基于inotify开发的,类似inotify-tools的工具
- sersync可以记录下被监听的目录中发生的变化的(增删改)具体某一个文件或者某一个目录的名字,然后使用rsync差异同步
- 因为服务异常导致的同步失败有记录,便于恢复,确保高可用
inotify与sersync区别
- inotify只能记录下被监听的目录发生了变化,并没有把具体是哪个文件或者哪个目录发生了变化记录下来
- rsync在同步的时候,并不具体知道是哪个文件或目录发生了变化,每次都是对整个目录进行同步,当数据量足够大的时候,同步整个目录非常浪费时间,效率也比较低
- sersync可以记录被监听目录发生变化的具体某个文件或者目录的名字
- rsync在同步时,只同步发生变化的文件或目录,每次发生变化的数据相对整个同步目录数据来说很小,rsync在遍历查找对比文件时,速度快,因此效率高。
同步过程:
- 在同步服务器上开启sersync服务,sersync负责监控配置路径中的文件系统事件变化;
- 调用rsync命令把更新的文件同步到目标服务器
- 需要在主服务器配置sersync,在同步目标服务器配置rsync server
同步过程原理
-
用户实时的向sersync服务器上写入更新文件数据
-
此时需要在同步主服务器上配置serync 服务
-
在另一台服务器开启rsync守护进程,以同步拉取来自sersync服务器上的数据
通过rsync的守护进程服务后可以发现,实际上sersync就是监控本地数据写入或更新事件。然后调用rsync客户端的命令,将写入或更新事件对应的文件通过rsync推送到目标服务器