1、什么是Rsync
Rsync(remote synchronize)是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件。Rsync使用所谓的“Rsync算法”来使本地和远 程两个主机之间的文件达到同步,这个算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度相当快。
Rsync本来是用于替代rcp的一个工具,目前由rsync.samba.org维护,所以rsync.conf文件的格式类似于samba的主配 置文件。Rsync可以通过rsh或ssh使用,也能以daemon模式去运行,在以daemon方式运行时Rsync server会打开一个873端口,等待客户端去连接。连接时,Rsync server会检查口令是否相符,若通过口令查核,则可以开始进行文件传输。第一次连通完成时,会把整份文件传输一次,以后则就只需进行增量备份。
Rsync支持大多数的类Unix系统,无论是Linux、Solaris还是BSD上都经过了良好的测试。此外,它在windows平台下也有相应的版本,如cwRsync和Sync2NAS等工具。
Rsync的基本特点如下:
1.可以镜像保存整个目录树和文件系统;
2.可以很容易做到保持原来文件的权限、时间、软硬链接等;
3.无须特殊权限即可安装;
4.优化的流程,文件传输效率高;
5.可以使用rsh、ssh等方式来传输文件,当然也可以通过直接的socket连接;
6.支持匿名传输。
2、Rsync同步算法
Rsync只所以同步文件的速度相当快,是因为“Rsync同步算法”能在很短的时间内计算出需要备份的数据,关于Rsync的同步算法描述如下:
假定在1号和2号两台计算机之间同步相似的文件A与B,其中1号对文件A拥有访问权,2号对文件B拥有访问权。并且假定主机1号与2号之间的网络带宽很小。那么rsync算法将通过下面的五个步骤来完成:
1、2号将文件B分割成一组不重叠的固定大小为S字节的数据块,最后一块可能会比S 小。
2、2号对每一个分割好的数据块执行两种校验:一种是32位的滚动弱校验,另一种是128位的MD4强校验
3、2号将这些校验结果发给1号。
4、1号通过搜索文件A的所有大小为S的数据块(偏移量可以任选,不一定非要是S的倍数),来寻找与文件B的某一块有着相同的弱校验码和强校验码的数据块。这项工作可以借助滚动校验的特性很快完成。
5、1号发给2号一串指令来生成文件A在2号上的备份。这里的每一条指令要么是对文件B经拥有某一个数据块而不须重传的证明,要么是一个数据块,这个数据块肯定是没有与文件B的任何一个数据块匹配上的。
3、Rsync安装
Rsync既然是一个远程数据同步工具,那么就需要两个计算机来完成这些工作:一台计算机上存储着需要同步的数据,另一台计算机上接收数据。这里我们将这两台计算机命名:一个为服务器,一个为客户端。我们就需要在服务器和客户端上分别安装Rsync。我的服务器和客户端都采用的是CentOS系统,服务器IP:192.168.92.129,客户端IP:192.168.92.131。
Rsync官网下载地址:
一、服务器安装Rsync
第一步:
跳转到Rsync压缩包所在路径,解压。我将这个压缩包放在了/app 目录下。
[root@localhost ~]# cd /app
[root@localhost ~]# tar zxf rsync-3.1.1.tar.gz
[root@localhost app]# lshtdocs php rsync-3.1.1 rsync-3.1.1.tar.gz tengine tomcat6
第二步:
安装Rsync,我将它安装到了/usr/local/rsync 下面,也是默认路径。
[root@localhost app]# cd rsync-3.1.1
[root@localhost rsync-3.1.1]# ./configure --prefix=/usr/local/rsync && make clean && make && make install
第三步:配置rsyncd.conf文件
rsyncd.conf是最重要的一个配置文件,但是安装完成后,是没有rsyncd.conf文件的,需要我们手动创建。我们在/usr/local/rsync/ 路径下创建etc目录,然后在etc目录下面创建rsyncd.conf文件。
[root@localhost rsync-3.1.1]# cd /usr/loc