一、rsync简介
rsync是linux系统下的数据镜像备份工具。使用快速增量备份工具Remote Sync可以远程同步,支持本地复制,或者与其他SSH、rsync主机同步。
二、rsync特性
rsync支持很多特性:
- 可以镜像保存整个目录树和文件系统
- 可以很容易做到保持原来文件的权限、时间、软硬链接等等
- 无须特殊权限即可安装
- 快速:第一次同步时rsync会复制全部内容,但在下一次只传输修改过的文件。rsync在传输数据的过程中
- 以实行压缩及解压缩操作,因此可以使用更少的带宽
- 安全:可以使用scp、ssh等方式来传输文件,当然也可以通过直接的socket连接
- 支持匿名传输,以方便进行网站镜像
三、 rsync的ssh认证协议
rsync命令来同步系统文件之前要先登录remote主机认证,认证过程中用到的协议有2种:
- ssh协议
- rsync协议
rsync server端不用启动rsync的daemon进程,只要获取remote host的用户名和密码就可以直接rsync同步文件
rsync server端因为不用启动daemon进程,所以也不用配置文件/etc/rsyncd.conf
ssh认证协议跟scp的原理是一样的,如果在同步过程中不想输入密码就用ssh-keygen -t rsa打通通道
//这种方式默认是省略了 -e ssh 的,与下面等价:
rsync -avz /SRC -e ssh root@172.16.12.129:/DEST
-a //文件宿主变化,时间戳不变
-z //压缩数据传输
//当遇到要修改端口的时候,我们可以:
rsync -avz /SRC -e "ssh -p2222" root@172.16.12.129:/DEST
//修改了ssh 协议的端口,默认是22
四、rsync的ssh认证协议
rsync命令来同步系统文件之前要先登录remote主机认证,认证过程中用到的协议有2种:
- ssh协议
- rsync协议
rsync server端不用启动rsync的daemon进程,只要获取remote host的用户名和密码就可以直接rsync同步文件
rsync server端因为不用启动daemon进程,所以也不用配置文件/etc/rsyncd.conf
//这种方式默认是省略了 -e ssh 的
// 下面就是把anaconda-ks.cfg文件传输到192.168.91.135主机的tmp目录下
[root@localhost ~]# rsync -avz anaconda-ks.cfg -e ssh root@192.168.91.135:/tmp/
-a //文件宿主变化,时间戳不变
-z //压缩数据传输
//当遇到要修改端口的时候,我们可以:
[root@localhost ~]# rsync -avz anaconda-ks.cfg -e "ssh -p222" root@192.168.91.135:/tmp/
//修改了ssh 协议的端口,默认是22。修改为222
rsync常用选项
名字 | 作用 |
---|---|
-a | –参数,相当于-rlptgoD, |
-r | –是递归 |
-l | –是链接文件,意思是拷贝链接文件 |
-i - | -列出 rsync 服务器中的文件 |
-p | –表示保持文件原有权限 |
-t | –保持文件原有时间 |
-g | –保持文件原有用户组 |
-o | –保持文件原有属主 |
-D | –相当于块设备文件 |
-z | –传输时压缩 |
-P | –传输进度 |
-v | –传输时的进度等信息,和-P有点关系 |
-q | –静默模式 |
rsync的命令格式常用的有以下三种:
rsync [OPTION]... SRC DEST
rsync [OPTION]... SRC [USER@]HOST:DEST
rsync [OPTION]... [USER@]HOST:SRC DEST
对应于上面三种命令格式,rsync有三种不同的工作模式:
拷贝本地文件。当SRC和DES路径信息都不包含有单个冒号":"分隔符时就启动这种工作模式。如:
[root@localhost ~]# ls
anaconda-ks.cfg initial-setup-ks.cfg
[root@localhost ~]# rsync anaconda-ks.cfg -a 123.txt
[root@localhost ~]# ls
123.txt anaconda-ks.cfg initial-setup-ks.cfg
使用一个远程shell程序(如rsh、ssh)来实现将本地机器的内容拷贝到远程机器。
当DST路径地址包含单个冒号":"分隔符时启动该模式。如:
[root@localhost ~]# rsync -avz anaconda-ks.cfg root@192.168.91.135:/tmp/test
root@192.168.91.135’s password:
sending incremental file list
anaconda-ks.cfg
sent 898 bytes received 35 bytes 622.00 bytes/sec
total size is 1,384 speedup is 1.48
[root@localhost ~]# ssh root@192.168.91.135 ‘ls -l /root’
root@192.168.91.135’s password:
total 12
-rw-------. 1 root root 1384 October 11 22:06 anaconda-ks.cfg
-rw-r–r--. 1 root root 1539 October 11 22:15 initial-setup-ks.cfg
-rw-------. 1 root root 1384 October 11 22:06 test
使用一个远程shell程序(如rsh、ssh)来实现将远程机器的内容拷贝到本地机器。
当SRC地址路径包含单个冒号":"分隔符时启动该模式。如:
[root@localhost ~]# ls
anaconda-ks.cfg initial-setup-ks.cfg test
[root@localhost ~]# rsync -avz root@192.168.91.134:/etc/yum.repos.d /root/
The authenticity of host '192.168.91.134 (192.168.91.134)' can't be established.
ECDSA key fingerprint is SHA256:zVKjiyBlSxN2OvRzvPJ/IuTh+ysJo/vayRVzEHtDSJE.
Are you sure you want to continue connecting (yes/no/[fingerprint])? yes
Warning: Permanently added '192.168.91.134' (ECDSA) to the list of known hosts.
root@192.168.91.134's password:
receiving incremental file list
yum.repos.d/
yum.repos.d/CentOS-Base.repo
yum.repos.d/redhat.repo
sent 66 bytes received 990 bytes 162.46 bytes/sec
total size is 2,953 speedup is 2.80
[root@localhost ~]# ls
anaconda-ks.cfg initial-setup-ks.cfg test yum.repos.d
[root@localhost ~]# ls /etc/yum.repos.d/
CentOS-Base.repo redhat.repo
五、 rsync+inotify
rsync与传统的cp、tar备份方式相比,rsync具有安全性高、备份迅速、支持增量备份等优点,通过rsync可以解决对实时性要求不高的数据备份需求,例如定期的备份文件服务器数据到远端服务器,对本地磁盘定期做数据镜像等。
随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出的更好的要求,rsync在高端业务系统中也逐渐暴露出了很多不足,首先,rsync同步数据时,需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了百万甚至千万量级,扫描所有文件将是非常耗时的。而且正在发生变化的往往是其中很少的一部分,这是非常低效的方式。其次,rsync不能实时的去监测、同步数据,虽然它可以通过linux守护进程的方式进行触发同步,但是两次触发动作一定会有时间差,这样就导致了服务端和客户端数据可能出现不一致,无法在应用故障时完全的恢复数据。基于以上原因,rsync+inotify组合出现了!
Inotify是一种强大的、细粒度的、异步的文件系统事件监控机制,linux内核从2.6.13起,加入了Inotify支持,通过Inotify可以监控文件系统中添加、删除,修改、移动等各种细微事件,利用这个内核接口,第三方软件就可以监控文件系统下文件的各种变化情况,而inotify-tools就是这样的一个第三方软件。
在前面有讲到,rsync可以实现触发式的文件同步,但是通过crontab守护进程方式进行触发,同步的数据和实际数据会有差异,而inotify可以监控文件系统的各种变化,当文件有任何变动时,就触发rsync同步,这样刚好解决了同步数据的实时性问题。
环境说明:
服务器类型 | IP地址 | 操作系统 |
---|---|---|
源服务器 | 192.168.91.134 | centos8 |
目标服务器 | 192.168.91.135 | centos8 |
需求:
把源服务器上/etc目录实时同步到目标服务器的/tmp/下
目标服务器操作:
//安装rsync服务端软件
[root@localhost ~]# yum -y install rsync
//关闭防火墙与selinux
[root@localhost ~]# systemctl stop firewalld
[root@localhost ~]# systemctl disable firewalld
[root@localhost ~]# getenforce
Enforcing
[root@localhost ~]# setenforce 0
[root@localhost ~]# sed -ri 's/^(SELINUX=).*/\1disabled/g' /etc/sysconfig/selinux
//设置rsyncd.conf配置文件
[root@localhost ~]# cat >> /etc/rsyncd.conf <<EOF
log file = /var/log/rsyncd.log # 日志文件位置,启动rsync后自动产生这个文件,无需提前创建
pidfile = /var/run/rsyncd.pid # pid文件的存放位置
lock file = /var/run/rsync.lock # 支持max connections参数的锁文件
secrets file = /etc/rsync.pass # 用户认证配置文件,里面保存用户名称和密码,必须手动创建这个文件
[etc_from_client] # 自定义同步名称
path = /tmp/ # rsync服务端数据存放路径,客户端的数据将同步至此目录
comment = sync etc from client
uid = root # 设置rsync运行权限为root
gid = root # 设置rsync运行权限为root
port = 873 # 默认端口
ignore errors # 表示出现错误忽略错误
use chroot = no # 默认为true,修改为no,增加对目录文件软连接的备份
read only = no # 设置rsync服务端为读写权限
list = no # 不显示rsync服务端资源列表
max connections = 200 # 最大连接数
timeout = 600 # 设置超时时间
auth users = admin # 执行数据同步的用户名,可以设置多个,用英文状态下逗号隔开
hosts allow = 192.168.91.135 # 允许进行数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
hosts deny = 192.168.1.1 # 禁止数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
EOF
//创建用户认证文件
[root@localhost ~]# echo 'admin:123456' > /etc/rsync.pass
[root@localhost ~]# cat /etc/rsync.pass
admin:123456
//设置文件权限
[root@localhost ~]# chmod 600 /etc/rsync*
[root@localhost ~]# ll /etc/rsync*
-rw-------. 1 root root 802 October 11 22:45 /etc/rsyncd.conf
-rw-------. 1 root root 13 October 11 22:47 /etc/rsync.pass
//启动rsync服务并设置开机自启动
[root@localhost ~]# yum -y install rsync-daemon.noarch
[root@localhost ~]# systemctl start rsyncd
[root@localhost ~]# systemctl enable rsyncd
Created symlink /etc/systemd/system/multi-user.target.wants/rsyncd.service → /usr/lib/systemd/system/rsyncd.service.
// 查看端口号
[root@localhost ~]# ss -antl
State Recv-Q Send-Q Local Address:Port Peer Address:Port
LISTEN 0 5 0.0.0.0:873 0.0.0.0:*
LISTEN 0 128 0.0.0.0:22 0.0.0.0:*
LISTEN 0 5 [::]:873 [::]:*
LISTEN 0 128 [::]:22 [::]:*
在源服务器上做以下操作:
// 安装epel源
[root@localhost ~]# yum -y install epel-release
// 安装inotify-tools
[root@localhost ~]# yum -y install inotify-tools
// 创建认证密码文件
[root@localhost ~]# echo '123' > /etc/rsync.pass
[root@localhost ~]# chmod 600 /etc/rsync.pass
// 创建测试目录
[root@localhost ~]# mkdir -p etc/test
[root@localhost ~]# ls
anaconda-ks.cfg etc
[root@localhost ~]# ls etc/
test
[root@localhost ~]# rsync -avH --port 873 --progress --delete /root/etc/ admin@192.168.91.135::etc_from_client --password-file=/etc/rsync.pass
sending incremental file list
deleting vmware-root_950-2697008400/
./
test/
sent 77 bytes received 58 bytes 270.00 bytes/sec
total size is 0 speedup is 0.00
root@localhost ~]# nohup bash /scripts/inotify.sh &
[1] 86871
[root@localhost ~]# nohup: ignoring input and appending output to ‘nohup.out’
[root@localhost ~]# ls /tmp/
test
[root@localhost scripts]# cat inotify.sh
host=192.168.91.135
src=/etc
des=etc_from_client
password=/etc/rsync.pass
user=admin
inotifywait=/usr/bin/inotifywait
$inotifywait -mrq --timefmt '%Y%m%d %H:%M' --format '%T %w%f%e' -e modify,delete,create,attrib $src \
| while read files;do
rsync -avzP --delete --timeout=100 --password-file=${password} $src $user@$host::$des
echo "${files} was rsynced" >>/tmp/rsync.log 2>&1
done
// 设置脚本开机自动启动:
[root@localhost ~]# chmod +x /etc/rc.d/rc.local
[root@localhost tmp]# vi /etc/rc.d/rc.local
#!/bin/bash
# THIS FILE IS ADDED FOR COMPATIBILITY PURPOSES
#
# It is highly advisable to create own systemd services or udev rules
# to run scripts during boot instead of using this file.
#
# In contrast to previous versions due to parallel execution during boot
# this script will NOT be run after all other services.
#
# Please note that you must run 'chmod +x /etc/rc.d/rc.local' to ensure
# that this script will be executed during boot.
nohup /scripts/inotify.sh &
touch /var/lock/subsys/local
[root@localhost ~]# ls /tmp/etc/
abc inputrc rc3.d
adjtime iproute2 rc4.d
aliases issue rc5.d
alternatives issue.net rc6.d
anacrontab kdump.conf rc.d
audit kernel rc.local
authselect krb5.conf redhat-release
bash_completion.d krb5.conf.d resolv.conf
bashrc ld.so.cache rhsm
bindresvport.blacklist ld.so.conf rpc
binfmt.d ld.so.conf.d rpm
chkconfig.d libaudit.conf rsync.pass
cifs-utils libnl rsyslog.conf
cron.d libreport rsyslog.d
cron.daily libssh rwtab.d
cron.deny libuser.conf sasl2
cron.hourly locale.conf security
cron.monthly localtime selinux
crontab login.defs services
cron.weekly logrotate.conf sestatus.conf
crypto-policies logrotate.d shadow
crypttab lvm shadow-
csh.cshrc machine-id shells
csh.login magic skel
dbus-1 makedumpfile.conf.sample ssh
default man_db.conf ssl
depmod.d microcode_ctl sssd
dhcp mke2fs.conf subgid
DIR_COLORS modprobe.d subgid-
DIR_COLORS.256color modules-load.d subuid
DIR_COLORS.lightbgcolor motd subuid-
dnf mtab sudo.conf
dracut.conf netconfig sudoers
dracut.conf.d NetworkManager sudoers.d
environment networks sudo-ldap.conf
ethertypes nftables swid
exports nsswitch.conf sysconfig
filesystems nsswitch.conf.bak sysctl.conf
firewalld openldap sysctl.d
fstab opt systemd
fuse.conf os-release system-release
gcrypt pam.d system-release-cpe
gnupg passwd tcsd.conf
GREP_COLORS passwd- terminfo
groff pkcs11 tmpfiles.d
group pki tuned
group- plymouth udev
grub2.cfg pm unbound
grub.d polkit-1 vconsole.conf
gshadow popt.d virc
gshadow- prelink.conf.d vmware-tools
gss printcap X11
host.conf profile xattr.conf
hostname profile.d xdg
hosts protocols xinetd.d
idmapd.conf rc0.d yum
init.d rc1.d yum.conf
inittab rc2.d yum.repos.d
// 到目标服务器上去查看是否把新生成的文件自动传上去了:
[root@localhost ~]# ls /tmp/etc/abc // 目标主机
/tmp/etc/abc
[root@localhost ~]# rm -rf /tmp/etc/abc //源主机
[root@localhost ~]# ls /tmp/etc/abc // 目标主机
ls: 无法访问'/tmp/etc/abc': 没有那个文件或目录