文章目录
1. rsync简介
rsync是linux系统下的数据镜像备份工具。使用快速增量备份工具Remote Sync可以远程同步,支持本地复制,或者与其他SSH、rsync主机同步。
2. rsync特性
rsync支持很多特性:
- 镜像可以保存整个目录树和文件系统
- 镜像可以保持文件原有属性,如文件的权限、时间、软硬链接等
- 无须特殊权限,普通用户也可安装
- 高速:第一次同步时rsync会复制全部内容,但在下一次只传输修改过的文件。rsync在传输数据的过程中可以实行压缩及解压缩操作,因此可以使用更少的带宽
- 安全:可以使用scp、ssh等方式来传输文件,当然也可以通过直接的socket(套接字IP+端口)连接
- 支持匿名传输,以方便进行网站镜像
3. rsync的ssh认证协议
rsync命令来同步系统文件之前要先登录remote主机认证,认证过程中用到的协议有2种:
- ssh协议
- rsync协议
rsync server端不用启动rsync的daemon进程,只要获取remote host的用户名和密码就可以直接rsync同步文件
rsync server端因为不用启动daemon进程,所以也不用配置文件/etc/rsyncd.conf
ssh认证协议跟scp的原理是一样的,如果在同步过程中不想输入密码就用ssh-keygen -t rsa打通通道
rsync -avz /SRC root@192.168.177.139:/DEST
//这种方式默认是省略了 -e ssh 的,与下面等价:
rsync -avz /SRC -e ssh root@192.168.177.139:/DEST
-a //文件宿主变化,时间戳不变
-z //压缩数据传输
-v //显示详细信息
/SRC 原目录 /DEST 默认目录
rsync -avz /SRC -e "ssh -p2222" root@192.168.177.139:/DEST
//修改了ssh 协议的端口,默认是22
4. rsync命令
//Rsync的命令格式常用的有以下三种:
rsync [OPTION]... SRC DEST
rsync [OPTION]... SRC [USER@]HOST:DEST
rsync [OPTION]... [USER@]HOST:SRC DEST
//对应于以上三种命令格式,rsync有三种不同的工作模式:
1)拷贝本地文件。当SRC和DES路径信息都不包含有单个冒号":"分隔符时就启动这种工作模式。如:
[root@node5 ~]# ls
anaconda-ks.cfg nfs.sh
[root@node5 ~]# rsync -a nfs.sh a.sh
[root@node5 ~]# ll
total 12
-rw-------. 1 root root 1453 Jun 13 19:27 anaconda-ks.cfg
-rwxr-xr-x 1 root root 1041 Aug 8 18:14 a.sh
-rwxr-xr-x 1 root root 1041 Aug 8 18:14 nfs.sh
[root@node5 ~]# ll -i
total 12
33574978 -rw-------. 1 root root 1453 Jun 13 19:27 anaconda-ks.cfg
33574979 -rwxr-xr-x 1 root root 1041 Aug 8 18:14 a.sh
33574990 -rwxr-xr-x 1 root root 1041 Aug 8 18:14 nfs.sh
2)使用远程shell程序(如rsh、ssh)将本地机器的内容拷贝到远程机器。当DST路径地址包 \
含单个冒号":"分隔符时启动该模式。如:
[root@node5 ~]# rsync -avz nfs.sh root@192.168.177.139:/root/b.sh
sending incremental file list
nfs.sh
sent 643 bytes received 35 bytes 1,356.00 bytes/sec
total size is 1,041 speedup is 1.54
[root@node5 ~]# ssh root@192.168.177.139 'ls -l /root'
total 8
-rw-------. 1 root root 1454 Aug 6 04:39 anaconda-ks.cfg
-rwxr-xr-x 1 root root 1041 Aug 8 2018 b.sh
3)使用远程shell程序(如rsh、ssh)将远程机器的内容拷贝到本地机器。当SRC地址路径 \
包含单个冒号":"分隔符时启动该模式。如:
[root@node5 ~]# ls
anaconda-ks.cfg a.sh nfs.sh
[root@node5 ~]# rsync -avz root@192.168.177.139:/etc/yum.repos.d /root/
receiving incremental file list
yum.repos.d/
yum.repos.d/163.repo
yum.repos.d/redhat.repo
sent 66 bytes received 918 bytes 1,968.00 bytes/sec
total size is 1,820 speedup is 1.85
[root@node5 ~]# ls
anaconda-ks.cfg a.sh nfs.sh yum.repos.d
[root@node5 ~]# ls yum.repos.d/
163.repo redhat.repo
rsync -avH --port 873 --progress --delete /root/etc/ admin@192.168.177.139::20220321 --password-file=/etc/.rsync.passwd
//rsync常用选项:
-a, --archive //归档
-v, --verbose //啰嗦模式
-q, --quiet //静默模式
-r, --recursive //递归
-p, --perms //保持原有的权限属性
-z, --compress //在传输时压缩,节省带宽,加快传输速度
--delete //在源服务器上做的删除操作也会在目标服务器上同步
5. rsync+inotify
5.1 rsync+inotify组合的优势
rsync与传统的cp、tar备份方式相比,rsync具有安全性高、备份迅速、支持增量备份等优点,通过rsync可以解决对实时性要求不高的数据备份需求,例如定期的备份文件服务器数据到远端服务器,对本地磁盘定期做数据镜像等。
随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出的更好的要求,rsync在高端业务**系统中也逐渐暴露出了很多不足 **;
- 首先,rsync同步数据时,效率较低。它需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了百万甚至千万量级,扫描所有文件将是非常耗时的。而且正在发生变化的往往是其中很少的一部分,这是非常低效的方式。
- 其次,rsync不能实时的去监测、同步数据。虽然它可以通过linux守护进程的方式进行触发同步,但是两次触发动作一定会有时间差,这样就导致了服务端和客户端数据可能出现不一致,无法在应用故障时完全的恢复数据。
基于以上原因,rsync+inotify组合出现了!
Inotify是一种强大的、细粒度的、异步的文件系统事件监控机制,linux内核从2.6.13起,加入了Inotify支持,通过Inotify可以监控文件系统中添加、删除,修改、移动等各种细微事件,利用这个内核接口,第三方软件就可以监控文件系统下文件的各种变化情况,而inotify-tools就是这样的一个第三方软件。
在前面有讲到,rsync可以实现触发式的文件同步,但是通