前言:本文转自http://www.mike.org.cn/blog/index.php?load=read&id=639###pp=0,但该地址已不存在,我是看到了这篇文章http://www.cnblogs.com/itech/archive/2009/08/10/1542945.html写得,但其中有很多笔误和歧义的地方,我自己也重新实现了一下,修改了其中的一些部分。
rsync可以实现网站的备份,文件的同步,不同系统的文件的同步,如果是windows的话,需要windows版本cwrsync
一、什么是rsync
rsync,remote synchronize顾名思意就知道它是一款实现远程同步功能的软件,它在同步文件的同时,可以保持原来文件的权限、时间、软硬链接等附加信息。rsync是用“rsync算法”提供了一个客户机和远程文件服务器的文件同步的快速方法,这个算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度相当快。而且可以通过ssh方式来传输文件,这样其保密性也非常好,另外它还是免费的软件。
rsync 包括如下的一些特性:
能更新整个目录和树和文件系统;
有选择性的保持符号链链、硬链接、文件属于、权限、设备以及时间等;
对于安装来说,无任何特殊权限要求;
对于多个文件来说,内部流水线减少文件等待的延时;
能用rsh、ssh 或直接端口做为传输端口;
支持匿名rsync同步文件,是理想的镜像工具;
二、架设rsync服务器
架设rsync服务器比较简单,写一个配置文件rsyncd.conf。文件的书写也是有规则的,我们可以参照rsync.samba.org上的文档来做。当然我们首先要安装好rsync这个软件才行;
A、rsync的安装
获取rsync:
rysnc的官方网站:http://rsync.samba.org/可以从上面得到最新的版本。当然,因为rsync是一款如此有用的软件,所以很多Linux的发行版本都将它收录在内了。
Centos6.5:
[root@localhost ~]# find / -name "rsync"
/usr/share/doc/man-pages-overrides-6.5.2/rsync
/usr/bin/rsync
/etc/xinetd.d/rsync
软件包安装:
sudo apt-get install rsync 注:在debian、ubuntu 等在线安装方法;
yum install rsync 注:Centos、Redhat 等在线安装方法;
rpm -ivh rsync 注:Centos、Redhat 等rpm包安装方法;
源码包安装:
tar xvf rsync-xxx.tar.gz
cd rsync-xxx
./configure --prefix=/usr ;make ;make install 注:在用源码包编译安装之前,您得安装gcc等编译开具才行;
B、配置文件
rsync的主要有以下三个配置文件rsyncd.conf(主配置文件)、rsyncd.secrets(密码文件)、rsyncd.motd(rysnc服务器信息)
服务器配置文件(/etc/rsyncd.conf),该文件默认不存在,请创建它。
具体步骤如下:
mkdir /etc/rsync
touch /etc/rsync/rsyncd.conf #创建rsyncd.conf,这是rsync服务器的配置文件。
touch /etc/rsync/rsyncd.secrets #创建rsyncd.secrets ,这是用户密码文件。
chmod 600 /etc/rsync/rsyncd.secrets #将rsyncd.secrets这个密码文件的文件属性设为root拥有, 且权限要设为600, 否则无法备份成功!
touch /etc/rsync/rsyncd.motd
下一步就是我们修改rsyncd.conf和rsyncd.secrets和rsyncd.motd文件的时候了。
rsyncd.conf是rsync服务器主要配置文件。我们先来个简单的示例,后面在详细说明各项作用。
比如我们要备份服务器上的/root/hui和/home/hadoop/qiang,在/root/hui中我想把easylife和samba目录排除在外;
设置/etc/rsync/rsyncd.conf:
# Distributed under the terms of the GNU General Public License v2
# Minimal configuration file for rsync daemon
# See rsync(1) and rsyncd.conf(5) man pages for help
# This line is required by the /etc/init.d/rsyncd script
pid file = /var/run/rsyncd.pid
port = 873
address = 192.168.205.148
#uid = nobody
#gid = nobody
uid = root
gid = root
use chroot = yes
read only = yes
#limit access to private LANs
hosts allow=192.168.205.157/255.255.255.0 192.168.205.158/255.255.255.0
hosts deny=*
max connections = 5
motd file = /etc/rsync/rsyncd.motd
#This will give you a separate log file
#log file = /var/log/rsync.log
#This will log every file transferred - up to 85,000+ per user, per sync
#transfer logging = yes
log format = %t %a %m %f %b
syslog facility = local3
timeout = 300
[centos6.5hui]
path = /root/hui
list=yes
ignore errors
auth users = root
secrets file = /etc/rsync/rsyncd.secrets
comment = This is hui
exclude = easylife/ samba/
[centos6.5qiang]
path = /home/hadoop/qiang
list=no
ignore errors
comment = This is qiang
auth users = hadoop
secrets file = /etc/rsync/rsyncd.secrets
注:关于auth users是必须在服务器上存在的真实的系统用户,如果你想用多个用户以,号隔开,比如auth users = hadoop,root
设置密码文件:
密码文件格式很简单,rsyncd.secrets的内容格式为:
用户名:密码
[root@localhost ~]# vi /etc/rsync/rsyncd.secrets
hadoop:keer
root:mike
[root@localhost ~]# chown root.root /etc/rsync/rsyncd.secrets#修改属主
[root@localhost ~]# chmod 600 /etc/rsync/rsyncd.secrets#修改权限
注意:
1、将rsyncd.secrets这个密码文件的文件属性设为root拥有, 且权限要设为600, 否则无法备份成功!出于安全目的,文件的属性必需是只有属主可读。
2、这里的密码值得注意,为了安全你不能把系统用户的密码写在这里。比如你的系统用户hadoop密码是123456,为了安全你可以让rsync中的hadoop为keer。这和samba的用户认证的密码原理是差不多的。
设置rsyncd.motd文件:
它是定义rysnc服务器信息的,也就是用户登录信息。比如让用户知道这个服务器是谁提供的等;类似ftp服务器登录时,我们所看到的 linuxsir.org ftp ……。 当然这在全局定义变量时,并不是必须的,你可以用#号注掉,或删除;我在这里写了一个rsyncd.motd的内容为:
++++++++++++++++++++++++++++++++++++++++++++++
Welcome to use the mike.org.cn rsync services!
2002------2009
++++++++++++++++++++++++++++++++++++++++++++++
三、rsyncd.conf服务器的配置详解
A、全局定义
在rsync服务器中,全局定义有几个比较关健的,根据我们前面所给的配置文件rsyncd.conf文件;
pid file = /var/run/rsyncd.pid 注:告诉进程写到/var/run/rsyncd.pid文件中;
port = 873 注:指定运行端口,默认是873,您可以自己指定;
address = 192.168.205.148 注:指定服务器IP地址
uid = nobody
gid = nobdoy
注:服务器端传输文件时,要发哪个用户和用户组来执行,默认是nobody。如果用nobody用户和用户组,可能遇到权限问题,有些文件从服务器上拉不下来。所以我就偷懒,为了方便,用了root。不过您可以在定义要同步的目录时定义的模块中指定用户来解决权限的问题。
use chroot = yes
注:用chroot,在传输文件之前,服务器守护程序在将chroot到文件系统中的目录中,这样做的好处是可能保护系统被安装漏洞侵袭的可能。缺点是需要超级用户权限。另外对符号链接文件,将会排除在外。也就是说,你在rsync服务器上,如果有符号链接,你在备份服务器上运行客户端的同步数据时,只会把符号链接名同步下来,并不会同步符号链接的内容;这个需要自己来尝试
read only = yes
注:read only是只读选择,也就是说,不让客户端上传文件到服务器上。还有一个write only选项,自己尝试是做什么用的吧;
#limit access to private LANs
hosts allow=192.168.205.157/255.255.255.0 192.168.205.158/255.255.255.0
注:在您可以指定单个IP,也可以指定整个网段,能提高安全性。格式是ip与ip之间、ip和网段之间、网段和网段之间要用空格隔开;
max connections = 5
注:客户端最多连接数
motd file = /etc/rsync/rsyncd.motd
注:motd file 是定义服务器信息的,要自己写 rsyncd.motd 文件内容。当用户登录时会看到这个信息。
log file = /var/log/rsync.log
注:rsync 服务器的日志;
transfer logging = yes
注:这是传输文件的日志
log format = %t %a %m %f %b
syslog facility = local3
timeout = 300
B、模块定义
模块定义什么呢?主要是定义服务器哪个目录要被同步。每个模块都要以[name]形式。这个名字就是在rsync客户端看到的名字,其实有点象Samba服务器提供的共享名。而服务器真正同步的数据是通过path指定的。我们可以根据自己的需要,来指定多个模块。每个模块要指定认证用户,密码文件、但排除并不是必须的
下面是前面配置文件模块的例子:
[centos6.5hui] #模块它为我们提供了一个链接的名字,在本模块中链接到了/hui目录;要用[name] 形式
path = /root/hui #指定文件目录所在位置,这是必须指定的
auth users = root #认证用户是root,是必须在服务器上存在的用户
list=yes #list意思是把rsync服务器上提供同步数据的目录在服务器上模块是否显示列出来。默认是yes 。如果你不想列出来,就no ;如果是no是比较安全的,至少别人不知道你的服务器上提供了哪些目录。你自己知道就行了;
ignore errors #忽略IO错误
secrets file = /etc/rsync/rsyncd.secrets #密码存在哪个文件
comment = he he #注释可以自己定义
exclude = beinan/ samba/
注:exclude是排除的意思,也就是说,要把/hui目录下的easylife和samba排除在外; easylife/和samba/目录之间有空格分开
[centos6.5qiang]
path = /home/hadoop/qiang
list=no
comment = ha ha
auth users = hadoop
secrets file = /etc/rsync/rsyncd.secrets
ignore errors
四、启动rsync服务器及防火墙的设置
启动rsync服务器相当简单,有以下几种方法
A、--daemon参数方式,是让rsync以服务器模式运行
#/usr/bin/rsync --daemon --config=/etc/rsync/rsyncd.conf #--config用于指定rsyncd.conf的位置,如果在/etc下可以不写
B、xinetd方式
修改services加入如下内容
# nano -w /etc/services
rsync 873/tcp # rsync
rsync 873/udp # rsync
这一步一般可以不做,通常都有这两行(我的RedHat和Centos默认都有)。修改的目的是让系统知道873端口对应的服务名为rsync。如没有的话就自行加入。
/etc/xinetd.d/rsync默认已经存在,下面是默认配置:
# default: off
# description: The rsync server is a good addition to an ftp server, as it \
# allows crc checksumming etc.
service rsync
{
disable = yes
flags = IPv6
socket_type = stream
wait = no
user = root
server = /usr/bin/rsync
server_args = --daemon
log_on_failure += USERID
}
原文章说是执行service xinetd restart可启动,但是我的Centos默认并没有这个命令啊,xinetd方式我目前并不是很明白
[root@localhost ~]# service xinetd restart
xinetd: unrecognized service
(可以忽略B方式,直接用A方式就行并不影响实验)
rsync服务器和防火墙
Linux防火墙是用iptables,所以我们至少在服务器端要让你所定义的rsync 服务器端口通过,客户端上也应该让通过。
#iptables -A INPUT -p tcp -m state --state NEW -m tcp --dport 873 -j ACCEPT
#iptables -L 查看一下防火墙是不是打开了 873端口
按这种方法在后面我客户端同步数据的时候并不好使并报错了:
[root@localhost ~]# rsync -avzP root@192.168.205.148::centos6.5hui centos6.5hui
rsync: failed to connect to 192.168.205.148: No route to host (113)
rsync error: error in socket IO (code 10) at clientserver.c(124) [receiver=3.0.6]
上述方法如果重启iptables或者虚拟机的话则该规则失效,为防重启将规则清除,我将规则直接加到规则配置文件里边了(/etc/sysconfig/iptables),如下:
-A INPUT -m state --state NEW -m tcp -p tcp --dport 873 -j ACCEPT
加好后,重启下iptables(# service iptables restart)。
注意:这条规则要加在REJECT规则前。因为规则的顺序很重要,比如一开始你就添加了一个阻止任何的规则,那么你下面的允许规则都不会起作用了。
如果你不太懂防火墙的配置,可以先service iptables stop将防火墙关掉。当然在生产环境这是很危险的,做实验才可以这么做哟!
五、通过rsync客户端来同步数据
A、语法详解
在配置完rsync服务器后,就可以从客户端发出rsync命令来实现各种同步的操作。rsync有很多功能选项,下面就对介绍一下常用的选项:
rsync的命令格式可以为:
1. rsync [OPTION]... SRC [SRC]... [USER@]HOST:DEST
2. rsync [OPTION]... [USER@]HOST:SRC DEST
3. rsync [OPTION]... SRC [SRC]... DEST
4. rsync [OPTION]... [USER@]HOST::SRC [DEST]
5. rsync [OPTION]... SRC [SRC]... [USER@]HOST::DEST
6. rsync [OPTION]... rsync://[USER@]HOST[:PORT]/SRC [DEST]
rsync有六种不同的工作模式:
1.拷贝本地文件;当SRC和DES路径信息都不包含有单个冒号":"分隔符时就启动这种工作模式。
2.使用一个远程shell程序(如rsh、ssh)来实现将本地机器的内容拷贝到远程机器。当DST路径地址包含单个冒号":"分隔符时启动该模式。
3.使用一个远程shell程序(如rsh、ssh)来实现将远程机器的内容拷贝到本地机器。当SRC地址路径包含单个冒号":"分隔符时启动该模式。
4.从远程rsync服务器中拷贝文件到本地机。当SRC路径信息包含"::"分隔符时启动该模式。
5.从本地机器拷贝文件到远程rsync服务器中。当DST路径信息包含"::"分隔符时启动该模式。
6.列远程机的文件列表。这类似于rsync传输,不过只要在命令中省略掉本地机信息即可。
-a 以archive模式操作、复制目录、符号连接 相当于-rlptgoD
rsync中的参数:
-r 是递归
-l 是链接文件,意思是拷贝链接文件;-p 表示保持文件原有权限;-t 保持文件原有时间;-g 保持文件原有用户组;-o 保持文件原有属主;-D 相当于块设备文件;
-z 传输时压缩;
-P 传输进度;
-v 传输时的进度等信息,和-P有点关系,自己试试。可以看文档;
-e ssh的参数建立起加密的连接。
-u只进行更新,防止本地新文件被重写,注意两者机器的时钟的同时
--progress是指显示出详细的进度情况
--delete是指如果服务器端删除了这一文件,那么客户端也相应把文件删除,保持真正的一致
--password-file=/password/path/file来指定密码文件,这样就可以在脚本中使用而无需交互式地输入验证密码了,这里需要注意的是这份密码文件权限属性要设得只有属主可读。
B、一些实例
B1、列出rsync服务器上的所提供的同步内容(在服务端192.168.205.148上执行);
首先:我们看看rsync服务器上提供了哪些可用的数据源
[root@localhost ~]# rsync --list-only root@192.168.205.148::
++++++++++++++++++++++++++++++++++++++++++++++
Welcome to use the mike.org.cn rsync services!
2002------2009
++++++++++++++++++++++++++++++++++++++++++++++
centos6.5hui This is hui
注:前面是rsync所提供的数据源,也就是我们在rsyncd.conf中所写的[centos6.5hui]模块。而“This is hui”是由[centos6.5hui]模块中的 comment = This is hui提供的;为什么没有把centos6.5qiang数据源列出来呢?因为我们在[centos6.5qiang]中已经把list=no了。
先制造测试数据否则会报这个错:
[root@localhost ~]# rsync --list-only root@192.168.205.148::centos6.5hui
++++++++++++++++++++++++++++++++++++++++++++++
Welcome to use the mike.org.cn rsync services!
2002------2009
++++++++++++++++++++++++++++++++++++++++++++++
Password:
@ERROR: chroot failed
rsync error: error starting client-server protocol (code 5) at main.c(1503) [receiver=3.0.6]
模拟测试数据:
[root@localhost ~]# mkdir hui
[root@localhost ~]# mkdir hui/easylife
[root@localhost ~]# mkdir hui/samba
[root@localhost ~]# mkdir hui/test
[root@localhost ~]# vi hui/test/hehe.txt
hello world!
[root@localhost ~]# vi hui/easylife/haha.txt
ni hao a
[root@localhost ~]# rsync --list-only root@192.168.205.148::centos6.5hui
++++++++++++++++++++++++++++++++++++++++++++++
Welcome to use the mike.org.cn rsync services!
2002------2009
++++++++++++++++++++++++++++++++++++++++++++++
Password:
drwxr-xr-x 4096 2017/08/01 20:50:04 .
drwxr-xr-x 4096 2017/08/01 20:50:40 test
注:后面的root@ip中,root是指定密码文件rsyncd.secrets中的用户名,之后的::centos6.5hui是centos6.5hui模块名
B2、rsync客户端同步数据(在192.168.205.157上执行):
[root@localhost ~]# rsync -avzP root@192.168.205.148::centos6.5hui /root/hui
++++++++++++++++++++++++++++++++++++++++++++++
Welcome to use the mike.org.cn rsync services!
2002------2009
++++++++++++++++++++++++++++++++++++++++++++++
Password:
receiving incremental file list
created directory /root/hui
./
test/
test/hehe.txt
13 100% 12.70kB/s 0:00:00 (xfer#1, to-check=0/3)
sent 88 bytes received 361 bytes 179.60 bytes/sec
total size is 13 speedup is 0.03
[root@localhost ~]# ls hui/
test
Password: 这里要输入root的密码,是服务器端rsyncd.secrets提供的。在前面的例子中我们用的是mike,输入的密码并不回显,输好就回车。
注:这个命令的意思就是说,用root用户登录到服务器上,把centos6.5hui数据同步到本地当前目录/root/hui上。当然本地的目录是可以你自己定义的。如果当你在客户端上当前操作的目录下没有/root/hui这个目录时,系统会自动为你创建一个;当存在/root/hui这个目录时,你要注意它的写权限。
[root@localhost ~]# touch /root/hui/ceshi.txt
[root@localhost ~]# rsync -avzP --delete root@192.168.205.148::centos6.5hui /root/hui/
++++++++++++++++++++++++++++++++++++++++++++++
Welcome to use the mike.org.cn rsync services!
2002------2009
++++++++++++++++++++++++++++++++++++++++++++++
Password:
receiving incremental file list
deleting ceshi.txt
./
sent 66 bytes received 305 bytes 82.44 bytes/sec
total size is 13 speedup is 0.04
[root@localhost ~]# ls /root/hui/
test
注:这回我们引入一个--delete选项,表示客户端上的数据要与服务器端完全一致,如果/root/hui/目录中有服务器上不存在的文件,则删除。最终目的是让/root/hui/目录上的数据完全与服务器上保持一致;用的时候要小心点,最好不要把已经有重要数所据的目录,当做本地更新目录,否则会把你的数据全部删除;
设置rsync client:
设定密码文件
#rsync -avzP --delete --password-file=/etc/rsync/rsyncd.secrets root@192.168.205.148::centos6.5hui /root/hui/
这次我们加了一个选项--password-file=/etc/rsync/rsyncd.secrets,这是当我们以root用户登录rsync服务器同步数据时,密码将读取rsyncd.secrets这个文件。这个文件内容只是root用户的密码。在执行这条命令前我们要如下做:
[root@localhost ~]# mkdir /etc/rsync
[root@localhost ~]# touch /etc/rsync/rsyncd.secrets
[root@localhost ~]# chmod 600 /etc/rsync/rsyncd.secrets
[root@localhost ~]# echo "mike"> /etc/rsync/rsyncd.secrets
[root@localhost ~]# rsync -avzP --delete --password-file=/etc/rsync/rsyncd.secrets root@192.168.205.148::centos6.5hui /root/hui/
++++++++++++++++++++++++++++++++++++++++++++++
Welcome to use the mike.org.cn rsync services!
2002------2009
++++++++++++++++++++++++++++++++++++++++++++++
receiving incremental file list
sent 63 bytes received 302 bytes 730.00 bytes/sec
total size is 13 speedup is 0.04
注:这里需要注意的是这份密码文件权限属性要设得只有属主可读。这样就不需要密码了;其实这是比较重要的,因为服务器通过crond计划任务还是有必要的;
B3、让rsync客户端自动与服务器同步数据(在192.168.205.157上执行):
服务器是重量级应用,所以数据的网络备份还是极为重要的。我们可以在生产型服务器上配置好rsync服务器。我们可以把一台装有rysnc机器当做是备份服务器。让这台备份服务器,每天在早上4点开始同步服务器上的数据;并且每个备份都是完整备份。有时硬盘坏掉,或者服务器数据被删除,完整备份还是相当重要的。这种备份相当于每天为服务器的数据做一个镜像,当生产型服务器发生事故时,我们可以轻松恢复数据,能把数据损失降到最低;是不是这么回事??
step1:创建同步脚本和密码文件
#mkdir /etc/cron.daily.rsync
#cd /etc/cron.daily.rsync
#touch centos65hui.sh centos65qiang.sh
#chmod 755 /etc/cron.daily.rsync/*.sh
#mkdir /etc/rsyncd/
#touch /etc/rsyncd/centos65huiroot.secrets
#touch /etc/rsyncd/centos65qianghadoop.secrets
#chmod 600 /etc/rsyncd/rsync.*
注:我们在/etc/cron.daily/中创建了两个文件centos65hui.sh和centos65qiang.sh,并且是权限是755的。创建了两个密码文件root用户用的是centos65huiroot.secrets,hadoop用户用的是centos65qianghadoop,权限是600;
我们编辑centos65hui.sh,内容是如下的:
#!/bin/sh
#backup 192.168.205.148:/root/hui
/usr/bin/rsync -avzP --password-file=/etc/rsync/centos65huiroot.secrets root@192.168.205.148::centos65hui /opt/centos65huibak/$(date +'%m-%d-%y')
我们编辑centos65qiang.sh,内容是:
#!/bin/sh
#backup 192.168.205.148:/home/hadoop/qiang
/usr/bin/rsync -avzP --password-file=/etc/rsync/centos65qianghadoop.secrets hadoop@192.168.205.148::centos65qiang /opt/centos65qiangbak/$(date +'%m-%d-%y')
注:你可以把centos65hui.sh和centos65qiang.sh的内容合并到一个文件中,比如都写到rhel4bak.sh中;
接着我们修改/etc/rsyncd/centos65huiroot.secrets和/etc/rsyncd/centos65qianghadoop.secrets的内容;
# echo "mike" > /etc/rsyncd/centos65huiroot.secrets
# echo "keer"> /etc/rsyncd/centos65qianghadoop.secrets
然后我们在/opt目录下创建centos65huibak和centos65qiangbak两个目录,意思是服务器端的centos65hui数据同步到备份服务器上的/opt/centos65huibak下,centos65qiang数据同步到/opt/centos65qiangbak/目录下。并按年月日归档创建目录;每天备份都存档;
#mkdir /opt/centos65huibak
#mkdir /opt/centos65qiangbak/
step2:修改crond服务器的配置文件 加入到计划任务
#crontab -e
加入下面的内容:
# Run daily cron jobs at 4:10 every day backup rhel4 data:
10 4 * * * /usr/bin/run-parts /etc/cron.daily.rsync 1> /dev/null
注:第一行是注释,是说明内容,这样能自己记住。第二行表示在每天早上4点10分的时候,运行/etc/cron.daily.rsync下的可执行脚本任务;
配置好后,要重启crond服务器;
# killall crond 注:杀死crond服务器的进程;
# ps aux |grep crond 注:查看一下是否被杀死;
# /usr/sbin/crond 注:启动crond服务器;
# ps aux |grep crond 注:查看一下是否启动了?
root 2658 10.7 0.1 117300 1348 ? Ss 02:58 0:00 /usr/sbin/crond
root 2660 0.0 0.0 103244 864 pts/1 S+ 02:58 0:00 grep crond
补充:
http://blog.csdn.net/u011414200/article/details/50411347
https://blog.wilddog.com/?p=862#masthead
http://www.ttlsa.com/web/let-infotify-rsync-fast/
http://kerry.blog.51cto.com/172631/734087/