服务器文件同步异常检测,Sersync实现触发式文件同步

目录

触发式文件同步

1:序言

如果我们后端有多台网站服务器或者文件服务器,而且没有好的文件同步机制,那么当我们升级程序或者更新文件的时候,就需要每台服务器或者目录都要更新,这样就很容易出问题,并很容易导致两边的文件不一致,从而出现很多莫名其妙的问题,因此我们需要使用好的文件同步方式来实现几个后端服务器文件的同步,目前广泛采用的方案是使用rsync+inotify的方式来实现文件的触发更新。原理是采用inotify来对文件进行监控,当监控到文件有文件发生改变的时候,就会调用rsync实现触发式实时同步!基于inotify+rsync进行二次开发实现文件同步的小工具sersync,能够很方便的实现文件触发式同步。

2:inotify

2.1:inotify简介

Inotify是基于inode级别的文件系统监控技术,是一种强大的,细粒度的异步机制,它满足各种各样的文件监控需要,不仅限于安全和性能,内核要求2.6.13以上,inotify能监控非常多的文件系统事件,通过监控这些事件来监控文件系统是否发生变更,然后通过rsync来更新发生变更的文件。

2.2:inotify可以监视的文件系统事件

IN_ACCESS                          //文件被访问

IN_MODIFY                          //文件被write

IN_ATTRIB                           //文件属性被修改,如chmod,chown,touch等

IN_CLOSE_WRITE                    //可写文件被close

IN_CLOSE_NOWRITE                 //不可写文件被close

IN_OPEN                            //文件被open

IN_MOVED_FROM                   //文件被移走 如mv,cp

IN_MOVED_TO                      //文件被移来

IN_CREATE                         //创建新文件

IN_DELETE                         //文件被删除,如rm

IN_DELETE_SELF,                   //自动删除,即一个可执行文件在执行时删除自己

IN_UNMOUNT                      //宿主文件系统被umount

IN_CLOSE                          //文件被关闭,等同于

IN_CLOSE_WRITE|IN_CLOSE_NOWRITE

IN_MOVE                          //文件被移动,等同于IN_MOVED_FROM /TO

备注:上面的文件也包括目录

3:rsync

3.1:rsync简介

Rsync,remote synchronize,它在同步文件的同时,可以保持原来文件的权限,时间,软硬链接等附加信息,rsync是用rsync算法提供了一个客户机和远程文件服务器的文件同步的快速方法,而且可以通过ssh方式来传输文件,这样保密性也非常好,另外它还是免费的软件。

3.2:Rsync特性

(1)能更新整个目录和树和文件系统

(2)由选择性的保留符号链接,硬链接,文件属于,权限,设备以及时间等

(3)对于安装来说,无任何特殊权限要求

(4)对于多个文件来说,内部流水线减少文件等待的延时

(5)能用ssh,rsh或直接端口作为传输入端口

(6)支持匿名rsync同步文件,是理想的镜像工具

4:sersync

4-1:sersync简介

Sersync利用inotify与rsync对服务器进行实时同步,其中inotify用于监控文件系统事件,rsync时目前广泛使用的同步算法,其优点时只对文件不同的部分进行操作,所以其优势大大超过使用挂接文件系统的方式来进行镜像同步。

4-2:sersync优点

(1) Sersync是使用c++编写,由于只同步发生更改的文件,因此比其它同步工具更节约时      间,带宽

(2)安装方便,配置简单

(3)使用多线程进行同步,能够保证多个服务器实时同步状态

(4)自带出错处理机制,通过失败队列出错的文件重新出错,如果仍旧失败,则每10个小      时对同步的文件重新同步

(5)自带crontab功能,只需在xml配置文件中开启,即可按您的要求,每隔一段时间整体      同步一次

(6)自带socket与http协议拓展,你可以方便的进行二次开发

5:两种架构

5.1:inotify-tools + rsync

(1):inotify-tools只能记录下被监听的目录发生了变化(包括增删改),并没有把具体时        哪个文件或者哪个目录发生了变化记录下来

(2):Rsync在同步的时候,并不知到具体时哪个文件或者哪个目录发生了变化,每次都是      对整个目录进行同步,当数据量很大时,整个 目录同步都非常耗时(rsync要对整个      目录遍历查找对比文件),因此效率很低

5.2:sersync + rsync

(1):sersync可以记录下被监听目录中发生变化的(包括增删改)具体某一个文件或某一个目录的名字

(2):Rsync在同步的时候,只同步发生变化的这个文件或目录(每次发生变化的数据相对于整个目录来说时很小的,rsync在遍历查找文件时,速度很快),因此,效率很高

6:为什么要用rsync+sersync

(1):sersync是基于inotify开发的,类似于inotify-tools的工具

(2):sersync可以记录下被监听目录中发生变化的(包括增,删,改)具体某一个文件或某一个目录的名字,然后使用rsync同步的时候,只同步发生变化的这个文件或者这个目录

7:具体操作:

7.1:实验环境

操作系统:Red Hat Enterprise Linux Server 6.5 (santiago)

源服务器:192.168.4.5

目标服务器:192.168.4.100  192.168.4.205

目的:把源服务器上/home/www.zhang.com目录实时同步到目标服务器的/home/www.zhang.com下

7.2:目标服务器操作

(1)关闭selinux

setenforce 0                    //立即生效,不用重启

1AD927882CC948C7B98BFC76CD1A1ED8

E6C53C2AD5F14F09B4FB3E84B8A043D6

(2)开启防火器tcp873端口(rsync默认端口)

A1C0A0C871A5499F8E3FA678204A675E

591E2A830C3645C8B28896ED9F854967

/etc/init.d/iptables restart                     //重启防火墙使配置生效

(3)安装rsync服务软件

827684A3B8D740E6AD5F30035EE72A23

DE5FB1899E0A4C25AB3A38576A785F5A

(4)将rsync交由超级管理进程管理

152ACC88B53945AD921B7AEB879EF5B7

C1BE65EECD2F42E6BD354095BA3D6951

/etc/init.d/xinetd start          //启动xinetd守护进程

(5)创建rsyncd.conf配置文件

A28116503ED2415ABCF64A9208D63088

F1E637B60A40413981DE929A293A26A0

(6)创建用户认证文件

9B6D8F4AAC4E440F92DD5D7F0B7A006A

E988D77D244E4CE788A81EBBE01C16AB

(7)设置文件权限

B5FF78856FCF4B9289872CAF1A8B656A

(8)启动rsync

0A882AC69B3445C0ADFE31941C7205B6

(9)创建同步目录与同步所用的账户

0F7E91C27F9E449088524F619A8A7F7A

7.3:在源服务器上操作

(1)关闭selinux

Setenforce = 0      //立即生效

A8F1F84C0D2E48E4820CD7734E74B16B

AC29F0079CDE446E842835A6608A28EB

(2)开启防火墙tcp 873端口

BE5FA121D6DE49AE9CEEA020381CB83E

C9A21B990F114766821BAD5FC2C4C749

/etc/init.d/iptables restart

(3)安装rsync客户端软件

EF912AFCF76749959D80EF139B395977

7032FE78397D48CFB5DE0033F5F3663A

(4)将rsync交由xinetd管理

1FD8B8D3184240A6BB8CFF673A582DC7

970B1C64BD264A97A7DD9E6F8DA031B1

/etc/init.d/xinetd  start

(6)创建认证文件,设置文件权限

6C5B7449061848D7AE7E07B3C56FC156

A9BFC36950EA4B8CA25B2D3B86797909

477F1BEE45344C44ACC62366EA438974

(7)测试服务器到源服务器之间的数据同步

BCF92DF21BFB4E9A9D39867B7AF4BFC1

A5EB0FB3FE49480EB31FB0E00A81143E

如果没变的话就不会传输

380778079FE5485AB44A89E2BE80C32E

(8)安装sersync工具,实时触发rsync进行同步

(8-1)查看服务器内核是否支持inotify

方法一:查看服务器内核是否支持inotigy,如果出现一下内容,说明服务器支持inotify

BF98E07DED4541A2960FD54B903B36DF

方法二:linux下支持inotify的内核最小为2.6.13,可以输入命令:uname  -r查看内核大小

D573CCFA36854AA6A0637383808BCFDB

(8-2)查看并修改inotify默认参数(inotify默认内核参数值太小)

Max_queued_events inotify:队列最大长度,如果值太小,会出现**Event Queue Overflow**错误,导致监控文件不准确

Max_user_watches:要同步的文件包含多少目录,可以用:find /home/www.dalu.com -type d |wc -l统计,必须保证max_user_watches值大于统计结果(这里/home/www.dalu.com为同步文件目录)

Max_user_instances:每个用户创建inotify实例最大值

ADB0AF496B09441DBF7A79A9FE3D0445

临时修改默认参数

D66BC9B9594D4BBB9210FCD1F9ED0148

将修改写入配置文件

DE35E0AD961B4868A705E1E41C98091E

75C49F7791F14FFEAEF1A7373E8915C1

(8-3)安装sersync

下载地址:https://sersync.googlecode.com/files/sersync2.5.4_64bit_binary_stable_final.tar.gz

7D0CB953BD9240C9917C4F9F57BB7738

(8-4)配置sersync

5AE09B6C2E0F46FC82FEE26E2E9E6D5E

EEC155BDC39A4F89BACA691029A13A77

参数说明:

24:

25:

25:Name=”home_www.dalu.com”/>               //目标服务器rsync同步用户名

31:

31:users=”home_www.dalu.com_user”             //目标服务器rsync同步用户名

31:passwordfile=”/etc/passwd.txt” >               //目标服务器rsync同步用户的密码在源                                               服务器的存放路径

36:

37:

(8-5)设置sersync监控开机自动启动

E83EBD3D5EA540788E979F535BEF2C6E

DD46753DD2534BABBC97C41307AA7298

(8-6)添加脚本监控sersync是否正常运行,因为有时候sersync脚本会自动关掉,因此需要写一个脚本自动的去检测该进程是否存在,不存在就启动

87D089BF05484616B8FBD98A75A0CB9D

9C3FEC97F708446C8712743FEBDF6BF5

(8-7)脚本写好后,添加到计划任务里,每5分钟检查一次

DD832F14136348429F0BB7A15DE49CA7

6907E8020447434FAA95A3101CE6F74F

7.4:测试

(1)删除

查看源服务器同步目录

C29730E4565B43FF9EB85BEEBD3BE4DF

查看目标服务器同步目录

30FC4E87942B4230935AC2657B6FBB38

删除源服务器同步目录中以l开头的文件并查看

59A35B9505B448E29A9AE34190319B93

查看目标服务器的同步目录

6E8210FFD66740CA931A21AA25046257

(2)新建

在目标服务器创建新文件

5E733BC27D7A4BF19F00735D12DB2797

查看源服务器同步目录

8F4B54187EB6407BA2AC1918920F1425

(3)修改

在源服务器修改new_document.txt内容

058A8895AF9D42D38EEDC0E8B1E5A694

查看目标服务器中new_ducument内容

D349168FB7574B27AC677B6D5A18E4C8

8可能遇到的问题

(1)测试的时候远程路径输错

4CA32E1E7C1D47FAA866AAAB1B6EAA49

将/去掉即可

8906C44973B84ADAAD17B5279BE2EB20

(2)测试的时候chdir failed

初遇这个问题,有点不知所措,因为这个没有学过,只做过本地同步,而且没那么多选项,没有那么多配置文件项,只能百度,但是度娘说是selinux的问题,但是我早就把selinux给关了,按他的方法做下来,依然没有解决问题。只能翻看自己的配置文件,最后发现,配置文件中的同步目录和创建的同步目录不是一个目录,改了之后可以了。

(3)同步多个目录

Sersync是多线程的,可以同步多个目录,但是不能写在同一个配置文件中,必须重写,并启起一个sersync进程。

(4)不同用户同步不同目录

刚开始将用户和密码都写在了一个文件中,但是老报语法错误,之后我将认证文件写在了不同文件中,并在相应的文件中做了修改,并设置为600权限,就可以了。

(5)同步多台主机

要是同步多台主机,修改.xml文件,多加几个remote ip就可以了

544EDF4068924E268B3DE09DD574DA56

9小结

(1)通过以上操作,可使服务器的/home/www.dalu.com/目录能从主服务器实时更新,升级的时候只升级主服务器的文件,从服务器也会自动更新过去,减少工作量以及出错的概率。

(2)当同步的目录数据量不大时,建议使用inotify+rsync;当数据量很大时(几百G甚至1T以上),建议使用sersync+rsync

附:rsync参数

rsync参数

-v, --verbose 详细模式输出

-q, --quiet 精简输出模式

-c, --checksum 打开校验开关,强制对文件传输进行校验

-a, --archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD

-r, --recursive 对子目录以递归模式处理

-R, --relative 使用相对路径信息

-b, --backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用--suffix选项来指定不同的备份文件前缀。

--backup-dir 将备份文件(如~filename)存放在在目录下。

-suffix=SUFFIX 定义备份文件前缀

-u, --update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件)

-l, --links 保留软链结

-L, --copy-links 想对待常规文件一样处理软链结

--copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结

--safe-links 忽略指向SRC路径目录树以外的链结

-H, --hard-links 保留硬链结

-p, --perms 保持文件权限

-o, --owner 保持文件属主信息

-g, --group 保持文件属组信息

-D, --devices 保持设备文件信息

-t, --times 保持文件时间信息

-S, --sparse 对稀疏文件进行特殊处理以节省DST的空间

-n, --dry-run现实哪些文件将被传输

-W, --whole-file 拷贝文件,不进行增量检测

-x, --one-file-system 不要跨越文件系统边界

-B, --block-size=SIZE 检验算法使用的块尺寸,默认是700字节

-e, --rsh=COMMAND 指定使用rsh、ssh方式进行数据同步

--rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息

-C, --cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件

--existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件

--delete 删除那些DST中SRC没有的文件

--delete-excluded 同样删除接收端那些被该选项指定排除的文件

--delete-after 传输结束以后再删除

--ignore-errors 及时出现IO错误也进行删除

--max-delete=NUM 最多删除NUM个文件

--partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输

--force 强制删除目录,即使不为空

--numeric-ids 不将数字的用户和组ID匹配为用户名和组名

--timeout=TIME IP超时时间,单位为秒

-I, --ignore-times 不跳过那些有同样的时间和长度的文件

--size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间

--modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0

-T --temp-dir=DIR 在DIR中创建临时文件

--compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份

-P 等同于--partial

--progress 显示备份过程

-z, --compress 对备份的文件在传输时进行压缩处理

--exclude=PATTERN 指定排除不需要传输的文件模式

--include=PATTERN 指定不排除而需要传输的文件模式

--exclude-from=FILE 排除FILE中指定模式的文件

--include-from=FILE 不排除FILE指定模式匹配的文件

--version 打印版本信息

--address 绑定到特定的地址

--config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件

--port=PORT 指定其他的rsync服务端口

--blocking-io 对远程shell使用阻塞IO

-stats 给出某些文件的传输状态

--progress 在传输时现实传输过程

--log-format=formAT 指定日志文件格式

--password-file=FILE 从FILE中得到密码

--bwlimit=KBPS 限制I/O带宽,KBytes per second

-h, --help 显示帮助信息

IN_ACCESS   被监控项目或者被监控目录中的条目被访问过。例如,一个打开的文件被读取。

IN_MODIFY   被监控项目或者被监控目录中的条目被修改过。例如,一个打开的文件被修改。

IN_ATTRIB     被监控项目或者被监控目录中条目的元数据被修改过。例如,时间戳或者许可被修改。

IN_CLOSE_WRITE        一个打开的,等待写入的文件或目录被关闭。

IN_CLOSE_NOWRITE  一个以只读方式打开的文件或目录被关闭。

IN_CLOSE    一个掩码,可以很便捷地对前面提到的两个关闭事件(IN_CLOSE_WRITE | IN_CLOSE_NOWRITE)进行逻辑操作。

IN_OPEN    文件或目录被打开。

IN_MOVED_FROM     被监控项目或者被监控目录中的条目被移出监控区域。该事件还包含一个 cookie 来实现 IN_MOVED_FROM 与 IN_MOVED_TO 的关联。

IN_MOVED_TO          文件或目录被移入监控区域。该事件包含一个针对 IN_MOVED_FROM 的 cookie。如果文件或目录只是被重命名,将能看到这两个事件,如果它只是被移入或移出非监控区域,将只能看到一个事件。如果移动或重命名一个被监控项目,监控将继续进行。参见下面的 IN_MOVE-SELF。

IN_MOVE    可以很便捷地对前面提到的两个移动事件(IN_MOVED_FROM | IN_MOVED_TO)进行逻辑操作的掩码。

IN_CREATE 在被监控目录中创建了子目录或文件。

IN_DELETE  被监控目录中有子目录或文件被删除。

IN_DELETE_SELF  被监控项目本身被删除。监控终止,并且将收到一个 IN_IGNORED 事件。

IN_MOVE_SELF    监控项目本身被移动。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值