Sersync+Rsync原理及部署

Rsync

1rsync是什么

  • rsync是一款开源的,快速的、多功能的、可实现全量及增量的本地或远程数据同步备份的优秀工具同步备份的优秀工具

2rsync的特性如下:

  1. 支持拷贝特殊文件如链接文件,设备等
  2. 可以有排除指定文件或目录同步的功能,相当于打包命令tar的排除功能。
  3. 可以做到保持原文件或目录等权限,时间,软硬链接,属主,属组等所有属性均不改变 –p
  4. 可实现增量同步,即只同步发生变化的数据,因此数据传输效率很高
  5. 可以使用rcp,rsh,ssh等方式来配置传输文件(rsync本身不对数据加密)
  6. 可以通过socket(守护进程方式)传输文件和数据(服务端和客户端)
  7. 支持匿名或认证(无需系统用户)的进程模式传输,可实现方便安全的进行数据备份及镜像
  8. rsync也相当于ls命令

3rsync的企业工作场景说明

  1. 两台服务器之间数据同步(定时任务+rsync)
  2. 实时同步(解决存储服务器的单点问题)

Rsync+Inotify-tools与Rsync+sersync这两种架构有什么区别

1.Rsync+Inotify-tools

(1):Inotify-tools只能记录下被监听的目录发生了变化(包括增加、删除、修改),并没有把具体是哪个文件或者哪个目录发生了变化记录下来;
(2):rsync在同步的时候,并不知道具体是哪个文件或者哪个目录发生了变化,每次都是对整个目录进行同步,当数据量很大时,整个目录同步非常耗时(rsync要对整个目录遍历查找对比文件),因此,效率很低。

2.Rsync+sersync

(1)sersync可以记录下被监听目录中发生变化的(包括增加、删除、修改)具体某一个文件或某一个目录的名字;
(2)rsync在同步的时候,只同步发生变化的这个文件或者这个目录(每次发生变化的数据相对整个同步目录数据来说是很小的,rsync在遍历查找比对文件时,速度很快),因此,效率很高

  当同步的目录数据量不大时,建议使用Rsync+Inotify-tools;当数据量很大(几百G甚至1T以上)、文件很多时,建议使用Rsync+sersync。

Rsync+sersync同步过程和原理:

1.  用户实时的往sersync服务器上写入更新文件数据;

2.  此时需要在同步主服务器上配置sersync服务,sersync负责监控配置路径中的文件系统事件变化;

3.  在另一台服务器开启rsync守护进程服务,以同步拉取来自sersync服务器上的数据;

通过rsync的守护进程服务后可以发现,实际上sersync就是监控本地的数据写入或更新事件;然后,在调用rsync客户端的命令,将写入或更新事件对应的文件通过rsync推送到目标服务器

配置操作

一台装rsync服务  10.100.14.39

三台装sersync     10.100.31.241、10.100.31.242、10.100.12.15

Rsync服务器(目标机器):10.100.14.39

Sersync服务器(源机器 ): 10.100.31.241、10.100.31.242、10.100.12.15

对源机器目录的/bdp-log-test 目录备份到目标机器的/data/bdp-log-test

1、使用rsync备份数据

三台源服务器都需要安装rsync

yum -y install xinetd rsync


目标服务器,系统配置文件  

vim /etc/rsyncd.conf  

uid=root
gid=root
max connections=36000
use chroot=no
log file = /dev/null
#syslog facility = local3
pid file=/var/run/rsyncd.pid
lock file=/var/run/rsyncd.lock
hosts allow = 127.0.0.1,127.0.0.2
auth users  = user1
secrets file  = /etc/rsync.password
read only =false
#
#可以把配置下放到 模块内
#模块1
[bdp-log-test]
path = /data/bdp-log-test

#模块2
[bdp-log]
path = /data/bdp-log

参数说明:

log file = /var/log/rsyncd.log   #日志文件位置,启动rsync后自动产生这个文件,无需提前创建
pidfile = /var/run/rsyncd.pid    #pid文件的存放位置
lock file = /var/run/rsync.lock  #支持max connections参数的锁文件
secrets file = /etc/rsync.pass   #用户认证配置文件,里面保存用户名称和密码,后面会创建这个文件
motd file = /etc/rsyncd.Motd     #rsync启动时欢迎信息页面文件位置(文件内容自定义)
[home_www.osyunwei.com]      #自定义名称
path = /data/book/       #rsync服务端数据目录路径
comment = book           #模块名称与[book]自定义名称相同
uid = root               #设置rsync运行权限为root
gid = root            #设置rsync运行权限为root
port=873              #默认端口
use chroot = no       #默认为true,修改为no,增加对目录文件软连接的备份
read only = no        #设置rsync服务端文件为读写权限
list = no             #不显示rsync服务端资源列表
max connections = 200   #最大连接数
timeout = 600           #设置超时时间
auth users = bookuser   #执行数据同步的用户名,可以设置多个,用英文状态下逗号隔开
hosts allow = 192.168.1.100    #允许进行数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
hosts deny = 192.168.21.254   #禁止数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
#创建密码文件
#服务器作为源和目标都有rsync.password文件,密码格式不一致,注意区分。
#目标服务上,rsync服务文件密码格式为 user:password
#源服务上,rsync服务文件密码格式为 password
echo 'user:password >/etc/rsync.password

#修改权限
chmod 600 /etc/rsync.password

#启动rsync服务
#启动后会将pid 存在文件,每次启动要清除pid:/var/run/rsyncd.pid
/usr/bin/rsync --daemon

#查rsync的端口为873
ss -tlunp|grep rsync

#加入开机自启动
vim /etc/rc.d/rc.local
/usr/bin/rsync --daemon

源机器端进行测试

rsync -avz a.txt user@tartget_IP::bdp-log-test --password-file=/etc/rsync.password #指定密码文件

2、使用sersync实时监控推送

目标服务器需要安装sersync

#下载sersync
wget https://sersync.googlecode.com/files/sersync2.5.4_64bit_binary_stable_final.tar.gz

#解压
tar fxz sersync2.5.4_64bit_binary_stable_final.tar.gz -C /usr/local/

cd /usr/local/

mv GNU-Linux-x86 sersync

#备份
cp sersync/confxml.xml sersync/confxml.xml.back
mv sersync/confxml.xml sersync/rsync_confxml.xml

更改sersync配置文件

<?xml version="1.0" encoding="ISO-8859-1"?>
<head version="2.5">
    <host hostip="localhost" port="8008"></host>
    <debug start="false"/>
    <fileSystem xfs="false"/>
    <filter start="false">
        <exclude expression="(.*)\.svn"></exclude>
        <exclude expression="(.*)\.gz"></exclude>
        <exclude expression="^info/*"></exclude>
        <exclude expression="^static/*"></exclude>
    </filter>
    <inotify>
        <delete start="false"/>
        <createFolder start="true"/>
        <createFile start="true"/>
        <closeWrite start="true"/>
        <moveFrom start="true"/>
        <moveTo start="true"/>
        <attrib start="true"/>
        <modify start="true"/>
    </inotify>

    <sersync>
        <localpath watch="/bdp-log-test">
            <remote ip="target_IP" name="/data/bdp-log-test"/>
            <!--<remote ip="192.168.8.39" name="tongbu"/>-->
            <!--<remote ip="192.168.8.40" name="tongbu"/>-->
        </localpath>
        <rsync>
            <commonParams params="-artuz"/>
            <auth start="true" users="user" passwordfile="/etc/rsync.password"/>
            <userDefinedPort start="false" port="874"/><!-- port=874 -->
            <timeout start="false" time="100"/><!-- timeout=100 -->
            <ssh start="false"/>
        </rsync>
        #sh 文件名称rsync和rsync_config.xml相对应
        <failLog path="/usr/local/sersync/logs/rsync_fail_log.sh" timeToExecute="60"/><!--default every 60mins execute once-->
        <crontab start="false" schedule="600"><!--600mins-->
            <crontabfilter start="false">
                <exclude expression="*.php"></exclude>
                <exclude expression="info/*"></exclude>
            </crontabfilter>
        </crontab>
        <plugin start="false" name="command"/>
    </sersync>

    <plugin name="command">
        <param prefix="/bin/sh" suffix="" ignoreError="true"/>  <!--prefix /opt/tongbu/mmm.sh suffix-->
        <filter start="false">
            <include expression="(.*)\.php"/>
            <include expression="(.*)\.sh"/>
        </filter>
    </plugin>

   #不知道用途
    <plugin name="socket">
        <localpath watch="/opt/tongbu">
            <deshost ip="192.168.138.20" port="8009"/>
        </localpath>
    </plugin>
    <plugin name="refreshCDN">
        <localpath watch="/data0/htdocs/cms.xoyo.com/site/">
            <cdninfo domainname="ccms.chinacache.com" port="80" username="xxxx" passwd="xxxx"/>
            <sendurl base="http://pic.xoyo.com/cms"/>
            <regexurl regex="false" match="cms.xoyo.com/site([/a-zA-Z0-9]*).xoyo.com/images"/>
        </localpath>
    </plugin>
</head>

rsync参数说明:

-v, --verbose 详细模式输出
-q, --quiet 精简输出模式
-c, --checksum 打开校验开关,强制对文件传输进行校验
-a, --archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD
-r, --recursive 对子目录以递归模式处理
-R, --relative 使用相对路径信息
-b, --backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用--suffix选项来指定不同的备份文件前缀。
--backup-dir 将备份文件(如~filename)存放在在目录下。
-suffix=SUFFIX 定义备份文件前缀
-u, --update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件)
-l, --links 保留软链结
-L, --copy-links 想对待常规文件一样处理软链结
--copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结
--safe-links 忽略指向SRC路径目录树以外的链结
-H, --hard-links 保留硬链结
-p, --perms 保持文件权限
-o, --owner 保持文件属主信息
-g, --group 保持文件属组信息
-D, --devices 保持设备文件信息
-t, --times 保持文件时间信息
-S, --sparse 对稀疏文件进行特殊处理以节省DST的空间
-n, --dry-run现实哪些文件将被传输
-W, --whole-file 拷贝文件,不进行增量检测
-x, --one-file-system 不要跨越文件系统边界
-B, --block-size=SIZE 检验算法使用的块尺寸,默认是700字节
-e, --rsh=COMMAND 指定使用rsh、ssh方式进行数据同步
--rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息
-C, --cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件
--existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件
--delete 删除那些DST中SRC没有的文件
--delete-excluded 同样删除接收端那些被该选项指定排除的文件
--delete-after 传输结束以后再删除
--ignore-errors 及时出现IO错误也进行删除
--max-delete=NUM 最多删除NUM个文件
--partial 
--force 强制删除目录,即使不为空
--numeric-ids 不将数字的用户和组ID匹配为用户名和组名
--timeout=TIME IP超时时间,单位为秒
-I, --ignore-times 不跳过那些有同样的时间和长度的文件
--size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间
--modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0
-T --temp-dir=DIR 在DIR中创建临时文件
--compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份
-P 等同于 --partial
--progress 显示备份过程
-z, --compress 对备份的文件在传输时进行压缩处理
--exclude=PATTERN 指定排除不需要传输的文件模式
--include=PATTERN 指定不排除而需要传输的文件模式
--exclude-from=FILE 排除FILE中指定模式的文件
--include-from=FILE 不排除FILE指定模式匹配的文件
--version 打印版本信息
--address 绑定到特定的地址
--config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件
--port=PORT 指定其他的rsync服务端口
--blocking-io 对远程shell使用阻塞IO
-stats 给出某些文件的传输状态
--progress 在传输时现实传输过程
--log-format=formAT 指定日志文件格式
--password-file=FILE 从FILE中得到密码
--bwlimit=KBPS 限制I/O带宽,KBytes per second
-h, --help 显示帮助信息

#添加访问目标机器密码
echo 'password' > /etc/rsync.password

#开启sersync守护进程同步数据,可以根据配置文件,启动多个进程,进行数据同步
# -o 指定配置文件   -d 后台启动守护进程   -r 主先与客户机同步一次,再有新数据就会时时同步
/usr/local/sersync/sersync2 -d -r -o /usr/local/sersync/rsync_confxml.xml
/usr/local/sersync/sersync2 -d -r -o /usr/local/sersync/test_confxml.xml

sersync2 参数说明:

参数-d:启用守护进程模式
参数-r:在监控前,将监控目录与远程主机用rsync命令推送一遍
c参数-n: 指定开启守护线程的数量,默认为10个
参数-o:指定配置文件,默认使用confxml.xml文件
参数-m:单独启用其他模块,使用 -m refreshCDN 开启刷新CDN模块
参数-m:单独启用其他模块,使用 -m socket 开启socket模块
参数-m:单独启用其他模块,使用 -m http 开启http模块
不加-m参数,则默认执行同步程序

设置开机自启动

vi /etc/rc.d/rc.local
/usr/local/sersync/sersync2 -d -r -o /usr/local/sersync/rsync_confxml.xml #设置开机自动运行脚本

chmod +x /etc/rc.d/rc.local

添加脚本监控sersync是否正常

touch check_sersync.sh
chmod 755 check.sersync.sh
vim check_sersync.sh


#每隔5分钟执行一次脚本
vi /etc/crontab
*/5 * * * * root /usr/local/sersync/check_sersync.sh >/dev/null 2>&1
#!/bin/sh

sersync="/usr/local/sersync/sersync2"
confxml="/usr/local/sersync/bdplog_confxml.xml"
status=$(ps aux | grep 'sersync2' | grep -v 'grep' | wc -l)

if [ $status -eq 0 ]; then
    echo '1'
    $sersync -d -r -o $confxml &
else
    exit 0
fi

  • 22
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值