rsync简介
rsync是linux系统下的数据镜像备份工具。使用快速增量备份工具Remote Sync可以远程同步,
支持本地复制,或者与其他SSH、rsync主机同步。
rsync的特性
- 可以镜像保存整个目录和文件系统
- 可以很容易做到保持原文件的权限、时间、软硬连接等
- 无须特殊权限即可安装
快速 第一次同步时rsync会复制全部内容,但在下一次只传输修改过的文件 rsync在传输数据的过程中可以实行压缩及解压缩操作,因此可以使用更少的宽带 安全 可以使用scp、ssh等方式来传输文件 也可通过直接socket连接 支持匿名传输,以方便进行网站镜像
rsync的ssh认证协议
rsync命令来同步系统文件之前要先登录remote主机认证,认证过程中用到的协议有2种:
1、ssh协议
2、rsync协议
rsync server端不用启动rsync的daemon进程,只要获取remote host的用户名和密码就可以直rsync同步文件
rsync server端因为不用启动daemon进程,所以也不用配置文件/etc/rsyncd.conf
ssh认证协议跟scp的原理是一样的,如果在同步过程中不想输入密码就用ssh-keygen -t rsa打通通道
rsync命令
命令格式
格式:rsync [选项] 原始位置 目标位置
rsync [OPTION]... SRC [USER@]HOST:DEST
rsync [OPTION]... [USER@]HOST:SRC DEST
常用选项
-a, --archive //归档,表示以递归方式传输文件,并保持所有属性
-v, --verbose //显示打印的信息,比如文件列表、文件数量等
-q, --quiet //不显示打印信息
-r, --recursive //递归,传输目录时必须加
-p, --perms //保持原有的权限属性
-z, --compress //在传输时压缩,节省带宽,加快传输速度
--delete //表示删除目标服务中源服务器没有的文件,在源服务器上做的删除操作也会在目标服务器上同步
实例
1
本地复制
[root@node1 tmp]# touch file1
[root@node1 tmp]# rsync file1 file123
[root@node1 tmp]# ls
file1 file123
[root@node1 tmp]#
2
拷贝到远程机器上
[root@node1 tmp]# rsync -avz file1 root@192.168.100.20:/tmp/file1
The authenticity of host '192.168.100.20 (192.168.100.20)' can't be established.
ED25519 key fingerprint is SHA256:6X4azVsTaqSFt4Du+6bzFCpH5+wW+fQpcaJeO7DkHxo.
This key is not known by any other names
Are you sure you want to continue connecting (yes/no/[fingerprint])? yes
Warning: Permanently added '192.168.100.20' (ED25519) to the list of known hosts.
root@192.168.100.20's password:
sending incremental file list
file1
sent 95 bytes received 35 bytes 20.00 bytes/sec
total size is 0 speedup is 0.00
查看192.168.100.10这台机器
[root@node2 tmp]# ls
file1
[root@node2 tmp]#
3
将远程机器上的内容拷贝到本地主机下
[root@node2 tmp]# touch file321 // 创建一个文件做实验
[root@node2 tmp]# ls
file1 file321
[root@node1 tmp]# rsync -avz root@192.168.100.20:/tmp/file321 /tmp/
root@192.168.100.20's password:
receiving incremental file list
file321
sent 43 bytes received 97 bytes 40.00 bytes/sec
total size is 0 speedup is 0.00
[root@node1 tmp]# ls
file1 file123 file321
[root@node1 tmp]#
成功拷贝到本地
rsync+inotify
rsync与传统的cp、tar备份方式相比,rsync具有安全性高、备份迅速、支持增量备份等优点,通过rsync可以解决对实时性要求不高的数据备份需求,例如定期的备份文件服务器数据到远端服务器,对本地磁盘定期做数据镜像等
随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出的更好的要求,rsync在高端业务系统中也逐渐暴露出了很多不足,
首先,rsync同步数据时,需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了百万甚至千万量级,扫描所有文件将是非常耗时的。
而且正在发生变化的往往是其中很少的一部分,这是非常低效的方式。其次,rsync不能实时的去监测、同步数据,
虽然它可以通过linux守护进程的方式进行触发同步,但是两次触发动作一定会有时间差,这样就导致了服务端和客户端数据可能出现不一致,
无法在应用故障时完全的恢复数据。基于以上原因,rsync+inotify组合出现了
Inotify是一种强大的、细粒度的、异步的文件系统事件监控机制,linux内核从2.6.13起,加入了Inotify支持,
通过Inotify可以监控文件系统中添加、删除,修改、移动等各种细微事件,利用这个内核接口,
第三方软件就可以监控文件系统下文件的各种变化情况,而inotify-tools就是这样的一个第三方软件。
在前面有讲到,rsync可以实现触发式的文件同步,但是通过crontab守护进程方式进行触发,
同步的数据和实际数据会有差异,而inotify可以监控文件系统的各种变化,当文件有任何变动时,
就触发rsync同步,这样刚好解决了同步数据的实时性问题。
实验
把源服务器上/root/etc目录实时同步到目标服务器的/tmp下
配置文件
/etc/rsync.conf
log file = /var/log/rsyncd.log # 日志文件位置,启动rsync后自动产生这个文件,无需提前创建
pidfile = /var/run/rsyncd.pid # pid文件的存放位置
lock file = /var/run/rsync.lock # 支持max connections参数的锁文件
secrets file = /etc/rsync.pass # 用户认证配置文件,里面保存用户名称和密码,必须手动创建这个文件
[etc_from_client] # 自定义同步名称
path = /tmp/ # rsync服务端数据存放路径,客户端的数据将同步至此目录
comment = sync etc from client
uid = root # 设置rsync运行权限为root
gid = root # 设置rsync运行权限为root
port = 873 # 默认端口
ignore errors # 表示出现错误忽略错误
use chroot = no # 默认为true,修改为no,增加对目录文件软连接的备份
read only = no # 设置rsync服务端为读写权限
list = no # 不显示rsync服务端资源列表
max connections = 200 # 最大连接数
timeout = 600 # 设置超时时间
auth users = admin # 执行数据同步的用户名,可以设置多个,用英文状态下逗号隔开
hosts allow = 192.168.100.10 # 允许进行数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
hosts deny = 192.168.1.1 # 禁止数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
创建用户认证文件
[root@node2 ~]# echo 'admin:linux' > /etc/rsync.pass
[root@node2 ~]# cat /etc/rsync.pass
admin:linux
设置文件权限,其他人不能查看我的用户和密码
[root@node2 ~]# chmod 600 /etc/rsync*
[root@node2 ~]# ll /etc/rsync*
-rw------- 1 root root 1572 Jul 23 18:46 /etc/rsyncd.conf
-rw------- 1 root root 12 Jul 23 20:07 /etc/rsync.pass
启动rsync服务并设置开机自启动
[root@node2 ~]# rsync --daemon
[root@node2 ~]# echo 'rsync --daemon --config=/etc/rsyncd.conf' >> /etc/rc.d/rc.local
目标主机端口已经启动好了
[root@node2 ~]# netstat -tulnp | grep 873
tcp 0 0 0.0.0.0:873 0.0.0.0:* LISTEN 520549/rsync
tcp6 0 0 :::873 :::* LISTEN 520549/rsync
[root@node2 ~]#
源服务器配置
创建认证密码文件
[root@node1 ~]# echo 'linux' > /etc/rsync.pass
[root@node1 ~]# cat /etc/rsync.pass
linux
[root@node1 ~]#
设置文件权限,只设置文件所有者具有读取、写入权限即可
[root@node1 ~]# chmod 600 /etc/rsync.pass
[root@node1 ~]# ll /etc/rsync.pass
-rw------- 1 root root 6 Jul 23 20:28 /etc/rsync.pass
[root@node1 ~]#
测试
创建测试目录
[root@node1 ~]# mkdir -pv /root/etc/test
mkdir: created directory '/root/etc'
mkdir: created directory '/root/etc/test'
同步数据
[root@node1 ~]# rsync -avH --port 873 --progress --delete /root/etc/ admin@192.168.100.20::etc_from_client --password-file=/etc/rsync.pass
sending incremental file list
./
test/
sent 87 bytes received 27 bytes 228.00 bytes/sec
total size is 0 speedup is 0.00
[root@node1 ~]#
同步完成查看目标主机,/tmp
[root@node2 ~]# cd /tmp/
[root@node2 tmp]# ls
test
[root@node2 tmp]#
同步成功
实时同步
安装inotify-tools工具,实时触发rsync进行同步
源服务器安装需要的包
yum -y install make gcc gcc-c++
yum -y install inotify-tools
写同步脚本,让脚本自动去检测我们制定的目录下,文件发生的变化,然后再执行rsync的命令把它同步到我们的服务器端去
[root@node1 ~]# mkdir /chenchen
[root@node1 ~]# cd /chenchen/
[root@node1 chenchen]# vim inotify.sh
在脚本下写入配置内容
host=192.168.100.20 # 目标服务器的ip(备份服务器)
src=/root/etc # 在源服务器上所要监控的备份目录(此处可以自定义,但是要保证存在)
des=etc_from_client # 自定义的模块名,需要与目标服务器上定义的同步名称一致
password=/etc/rsync.pass # 执行数据同步的密码文件
user=admin # 执行数据同步的用户名
inotifywait=/usr/bin/inotifywait
$inotifywait -mrq --timefmt '%Y%m%d %H:%M' --format '%T %w%f%e' -e modify,delete,create,attrib $src | while read files;do
rsync -avzP --delete --timeout=100 --password-file=${password} $src $user@$host::$des
echo "${files} was rsynced" >>/tmp/rsync.log 2>&1
done
设置权限
[root@node1 chenchen]# chmod +x /chenchen/inotify.sh
启动脚本
[root@node1 chenchen]# nohup bash /chenchen/inotify.sh &
[1] 641007
[root@node1 chenchen]# nohup: ignoring input and appending output to 'nohup.out'
[root@node1 chenchen]#
查看进程
[root@node1 ~]# ps -ef | grep inotify
root 641007 300436 0 21:09 pts/0 00:00:00 bash /chenchen/inotify.sh
root 641008 641007 0 21:09 pts/0 00:00:00 /usr/bin/inotifywait -mrq --timefmt %Y%m%d %H:%M --format %T %w%f%e -e modify,delete,create,attrib /root/etc
root 641009 641007 0 21:09 pts/0 00:00:00 bash /chenchen/inotify.sh
root 645886 300436 0 21:11 pts/0 00:00:00 grep --color=auto inotify
先创建一个文件在查看日志文件
[root@node1 ~]# touch /root/etc/file123
[root@node1 ~]# tail /tmp/rsync.log
20240723 21:14 /root/etc/file123CREATE was rsynced
20240723 21:14 /root/etc/file123ATTRIB was rsynced
日志文件上可以看到已经创建了一个文件
源服务器设置脚本开机自启
[root@node2 ~]# chmod +x /etc/rc.d/rc.local
[root@node2 ~]# ll /etc/rc.d/rc.local
-rwxr-xr-x 1 root root 514 Jul 23 20:22 /etc/rc.d/rc.local
[root@node2 ~]# echo 'nohup /bin/bash /chenyu/inotify.sh' >> /etc/rc.d/rc.local
[root@node2 ~]# tail /etc/rc.d/rc.local
#
# In contrast to previous versions due to parallel execution during boot
# this script will NOT be run after all other services.
#
# Please note that you must run 'chmod +x /etc/rc.d/rc.local' to ensure
# that this script will be executed during boot.
touch /var/lock/subsys/local
rsync --daemon --config=/etc/rsyncd.conf
nohup /bin/bash /chenyu/inotify.sh
[root@node2 ~]#
测试是否同步了
[root@node2 tmp]# ls
etc test
[root@node2 tmp]# cd etc/
[root@node2 etc]# ls
files123 test
[root@node2 etc]# pwd
/tmp/etc
同步成功