rsync+inotify实时同步——筑梦之路

#!/bin/bash
src=/data/                           # 需要同步的源路径
des=data                             # 目标服务器上 rsync --daemon 发布的名称,rsync --daemon这里就不做介绍了,网上搜一下,比较简单。
rsync_passwd_file=/etc/rsyncd.passwd            # rsync验证的密码文件
ip1=192.168.0.18                 # 目标服务器1
ip2=192.168.0.19                 # 目标服务器2
user=root                            # rsync --daemon定义的验证用户名
cd ${src}                            
# 此方法中,由于rsync同步的特性,这里必须要先cd到源目录,inotify再监听 ./ 才能rsync同步后目录结构一致,有兴趣的同学可以进行各种尝试观看其效果
/usr/local/bin/inotifywait -mrq --format  '%Xe %w%f' -e modify,create,delete,attrib,close_write,move ./ | while read file
# 把监控到有发生更改的"文件路径列表"循环
do
        INO_EVENT=$(echo $file | awk '{print $1}')      # 把inotify输出切割 把事件类型部分赋值给INO_EVENT
        INO_FILE=$(echo $file | awk '{print $2}')       # 把inotify输出切割 把文件路径部分赋值给INO_FILE
        echo "-------------------------------$(date)------------------------------------"
        echo $file
        #增加、修改、写入完成、移动进事件
        #增、改放在同一个判断,因为他们都肯定是针对文件的操作,即使是新建目录,要同步的也只是一个空目录,不会影响速度。
        if [[ $INO_EVENT =~ 'CREATE' ]] || [[ $INO_EVENT =~ 'MODIFY' ]] || [[ $INO_EVENT =~ 'CLOSE_WRITE' ]] || [[ $INO_EVENT =~ 'MOVED_TO' ]]         # 判断事件类型
        then
                echo 'CREATE or MODIFY or CLOSE_WRITE or MOVED_TO'
                rsync -avzcR --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip1}::${des} &&
# INO_FILE变量代表路径哦  -c校验文件内容
                rsync -avzcR --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip2}::${des}
#仔细看 上面的rsync同步命令 源是用了$(dirname ${INO_FILE})变量 即每次只针对性的同步发生改变的文件的目录(只同步目标文件的方法在生产环境的某些极端
#环境下会漏文件 现在可以在不漏文件下也有不错的速度 做到平衡)
#然后用-R参数把源的目录结构递归到目标后面 保证目录结构一致性
        fi
        #删除、移动出事件
        if [[ $INO_EVENT =~ 'DELETE' ]] || [[ $INO_EVENT =~ 'MOVED_FROM' ]]
        then
                echo 'DELETE or MOVED_FROM'
                rsync -avzR --delete --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip1}::${des} &&
                rsync -avzR --delete --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip2}::${des}
#看rsync命令 如果直接同步已删除的路径${INO_FILE}会报no such or directory错误 所以这里同步的源是被删文件或目录的上一级路径
#并加上--delete来删除目标上有而源中没有的文件,这里不能做到指定文件删除,如果删除的路径越靠近根,则同步的目录月多,同步删除的操作就越花时间。
#这里有更好方法的同学,欢迎交流。
        fi
        #修改属性事件 指 touch chgrp chmod chown等操作
        if [[ $INO_EVENT =~ 'ATTRIB' ]]
        then
                echo 'ATTRIB'
                if [ ! -d "$INO_FILE" ]
# 如果修改属性的是目录 则不同步,因为同步目录会发生递归扫描,等此目录下的文件发生同步时,rsync会顺带更新此目录。
                then
                        rsync -avzcR --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip1}::${des} &&         
                        rsync -avzcR --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip2}::${des}
                fi
        fi
done


#定时任务 全量同步
* */2 * * * rsync -avz --password-file=/etc/rsync-client.pass /data/ root@192.168.0.18::data && rsync -avz --password-file=/etc/rsync-client.pass /data/ root@192.168.0.19::data


#参数说明

-m,–monitor	始终保持事件监听状态
-r,–recursive	递归查询目录
-q,–quiet	只打印监控事件的信息
–excludei	排除文件或目录时,不区分大小写
-t,–timeout	超时时间
–timefmt	指定时间输出格式
–format	指定时间输出格式
-e,–event	后面指定删、增、改等事件

#事件说明
access	读取文件或目录内容
modify	修改文件或目录内容
attrib	文件或目录的属性改变
close_write	修改真实文件内容
close_nowrite	 
close	 
open	文件或目录被打开
moved_to	文件或目录移动到
moved_from	文件或目录从移动
move	移动文件或目录移动到监视目录
create	在监视目录下创建文件或目录
delete	删除监视目录下的文件或目录
delete_self	 
unmount	卸载文件系统

#优化
max_user_watches   #设置inotifywait或inotifywatch命令可以监视的文件数量(单进程)
max_user_instances #设置每个用户可以运行的inotifywait或inotifywatch命令的进程数
max_queued_events  #设置inotify实例事件(event)队列可容纳的事件数量

echo 50000000 > /proc/sys/fs/inotify/max_user_watches
echo 50000000 > /proc/sys/fs/inotify/max_queued_events


#rsync命令格式
1 rsync [OPTION]... SRC DEST
2 rsync [OPTION]... SRC [USER@]HOST:DEST
3 rsync [OPTION]... [USER@]HOST:SRC DEST
4 rsync [OPTION]... [USER@]HOST::SRC DEST
5 rsync [OPTION]... SRC [USER@]HOST::DEST
6 rsync [OPTION]... rsync://[USER@]HOST[:PORT]/SRC [DEST]

1)拷贝本地文件。当SRC和DES路径信息都不包含有单个冒号”:”分隔符时就启动这种工作模式。如:rsync -a /data /backup

  2)使用一个远程shell程序(如rsh、ssh)来实现将本地机器的内容拷贝到远程机器。当DST路径地址包含单个冒号”:”分隔符时启动该模式。如:rsync -avz *.c foo:src

  3)使用一个远程shell程序(如rsh、ssh)来实现将远程机器的内容拷贝到本地机器。当SRC地址路径包含单个冒号”:”分隔符时启动该模式。如:rsync -avz foo:src/bar /data

  4)从远程rsync服务器中拷贝文件到本地机。当SRC路径信息包含”::”分隔符时启动该模式。如:rsync -av root@172.16.78.192::www /databack

  5)从本地机器拷贝文件到远程rsync服务器中。当DST路径信息包含”::”分隔符时启动该模式。如:rsync -av /databack root@172.16.78.192::www

  6)列远程机的文件列表。这类似于rsync传输,不过只要在命令中省略掉本地机信息即可。如:rsync -v rsync://172.16.78.192/www


###rsync参数:
-v, --verbose     详细模式输出
-q, --quiet       精简输出模式
-c, --checksum    打开校验开关,强制对文件传输进行校验
-a, --archive     归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD
-r, --recursive   对子目录以递归模式处理
-R, --relative    使用相对路径信息
-b, --backup      创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。       可以使用--suffix选项来指定不同的备份文件前缀。
--backup-dir      将备份文件(如~filename)存放在在目录下。
-suffix=SUFFIX    定义备份文件前缀
-u, --update      仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件)
-l, --links       保留软链结
-L, --copy-links  想对待常规文件一样处理软链结
--copy-unsafe-links     仅仅拷贝指向SRC路径目录树以外的链结
--safe-links            忽略指向SRC路径目录树以外的链结
-H, --hard-links       保留硬链结
-p, --perms            保持文件权限
-o, --owner            保持文件属主信息
-g, --group            保持文件属组信息
-D, --devices          保持设备文件信息
-t, --times            保持文件时间信息
-S, --sparse           对稀疏文件进行特殊处理以节省DST的空间
-n, --dry-run          现实哪些文件将被传输
-W, --whole-file       拷贝文件,不进行增量检测
-x, --one-file-system  不要跨越文件系统边界
-B, --block-size=SIZE  检验算法使用的块尺寸,默认是700字节
-e, --rsh=COMMAND      指定使用rsh、ssh方式进行数据同步
--rsync-path=PATH      指定远程服务器上的rsync命令所在路径信息
-C, --cvs-exclude      使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件
--existing             仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件
--delete               删除那些DST中SRC没有的文件
--delete-excluded      同样删除接收端那些被该选项指定排除的文件
--delete-after         传输结束以后再删除
--ignore-errors        及时出现IO错误也进行删除
--max-delete=NUM       最多删除NUM个文件
--partial              保留那些因故没有完全传输的文件,以是加快随后的再次传输
--force                强制删除目录,即使不为空
--numeric-ids          不将数字的用户和组ID匹配为用户名和组名
--timeout=TIME         IP超时时间,单位为秒
-I, --ignore-times     不跳过那些有同样的时间和长度的文件
--size-only            当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间
--modify-window=NUM    决定文件是否时间相同时使用的时间戳窗口,默认为0
-T --temp-dir=DIR      在DIR中创建临时文件
--compare-dest=DIR     同样比较DIR中的文件来决定是否需要备份
-P                     等同于 --partial
--p rogress            显示备份过程
-z, --compress         对备份的文件在传输时进行压缩处理
--exclude=PATTERN      指定排除不需要传输的文件模式
--include=PATTERN      指定不排除而需要传输的文件模式
--exclude-from=FILE    排除FILE中指定模式的文件
--include-from=FILE    不排除FILE指定模式匹配的文件
--version              打印版本信息
--address              绑定到特定的地址
--config=FILE          指定其他的配置文件,不使用默认的rsyncd.conf文件
--port=PORT            指定其他的rsync服务端口
--blocking-io          对远程shell使用阻塞IO
-stats                 给出某些文件的传输状态
--progress             在传输时现实传输过程
--log-format=formAT    指定日志文件格式
--password-file=FILE   从FILE中得到密码
--bwlimit=KBPS         限制I/O带宽,KBytes per second
-h, --help             显示帮助信息


参考链接:真正的inotify+rsync实时同步 彻底告别同步慢 - 琴酒网络 - 博客园我们公司在用inotify+rsync做实时同步,来解决分布式集群文件一致性的问题。但当web文件越来越多(百万级数量html,jpg等小 文件),同步就越来越慢,根本做不到实时,按照网上的调优方法都https://www.cnblogs.com/ginvip/p/6430986.html

rsync 其他使用示例:

1.本地复制

rsync /etc/passwd 123.txt

2.远程同步

ssh免密登陆或者使用密码文件--password-file=/etc/pass.txt

明文可能不安全


rsync -av root@192.168.1.2:/root/123.txt .


指定端口 -e

rsync -e 'ssh -p 60920' -ahqzt /root/master3.sql root@192.168.1.2:/root/

在传输过程中查看rsync进度(--progress)

rsync -avz --progress /root/temp/ root@192.168.1.2:/root/temp

3.单向备份  --delete

如果文件不在源中而是在目标中存在,则可能希望在rsync同步期间删除目标上的文件。在这种情况下,请使用--delete选项:

rsync -avz --delete /root/temp root@192.168.1.2:/root/temp

4. 文件传输过程中的include和exclude模式

rsync允许在进行同步时提供要包括和排除文件或目录的模式

rsync -avz --include 'P*' --exclude '*' root@192.168.1.2:/var/lib/rpm/ /root/temp/

5.排除的文件和目录(--exclude-from)

使用--exclude-from参数,并指定要在文件中排除的文件和目录

rsync -a --exclude-from='/exclude-file.txt' /src_directory/ /dst_directory/

加入需要排除的文件,比如文件file1.c,目录zcwyou:
cat /exclude-file.txt
file1.c
zcwyou

6.不传输大文件(--max-size)

可以使用rsync --max-size选项告诉rsync不要传输大于指定大小的文件

rsync -avz --max-size='1M' root@192.168.1.2:/var/lib/rpm/ /root/temp/
--max-size=1M使rsync仅传输小于或等于1M的文件。单位可以是K,M,G等。
还可以使用--min-size=参数,指定传输最小文件的大小。

7.传输成功后删除源文件(--remove-source-files)

假设你有一个主web服务器和一个数据备份服务器,你创建了一个每日备份并与备份服务器同步,现在你不想在你的web服务器上保留备份的本地副本。

那么,您会等待传输完成,然后手动删除本地备份文件吗?这样做肯定有点麻烦,这种自动删除可以使用–remove-source-files选项来完成。

rsync --remove-source-files -zvh backup.tar.gz root@192.168.0.151:/home/backup/

检查:
ls -l backup.tar.gz

8.限制Rsync传输时的带宽(--bwlimit)

在将数据从一台机器传输到另一台机器时,可以使用–bwlimit选项设置带宽限制。这个选项可以帮助我们限制Rsync占用的网络带宽。

rsync --bwlimit=100 -avzhe ssh  /var/lib/rpm/  root@192.168.0.151:/root/tmprpm/

另外,默认情况下rsync只同步更改的块和字节,如果你想完整同步整个文件或目录,那么你可以使用-W选项。

9.定时任务示例

30 22 * * * /usr/bin/rsync -az --delete --password-file=/root/123.pass backuper@192.168.1.1::wwwroot /a

vim /root/123.pass  && chmod 600 /root/123.pass

systemctl restart crond

10.同步目录

#!/bin/bash

SRC=/data/path1/ #192.168.1.3 发送端目录
DST=/data/path1/ #192.168.1.2 接收端目录
IP="192.168.1.2"
USER=www

#同步文件
/usr/bin/rsync -e 'ssh -p 22' -ahqzt \
--exclude ".git" \
--exclude "www/Conf/config.php" \
--exclude "www/Public/ueditor/*" \
--exclude "README.md" \
--delete $SRC $USER@$IP:$DST

-ahqzt
-a:归档模式
-h:输出文件大小使用易读的单位(如,K,M等)
-q:精简输出模式
-z: 在传输文件时进行压缩
-t: 保留文件的时间标记
--exclude: 不需要同步的文件或目录
--delete: 删除那些接收端还有而发送端已经不存在的文件

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值