即使是Git这样的分布式版本控制工具,在日常的使用中,也通常会有一个集中的server供所有人访问,在公司开发环境中尤其是这样。既然每个Git用户都在本地有一个完整的版本库,是否还有必要做server端的数据备份呢?当然需要。虽然每个git client都有版本拷贝,但并不是每个拷贝都及时更新了;有些比较旧或者使用比较少的版本库已经没有用户备份了;当server出问题时,需要有另一台机器可以马上担当临时server的角色,并且可以为server的恢复提供可靠的数据。
笔者所在的项目组有的使用gitolite,有的使用gerrit,最好针对两个工具有统一的备份方案。最简单的方案是在mirror机器上用命令git clone --mirror url:repo生成版本库的镜像,然后设定一个cron job定时对每个mirror库运行git remote update做更新。这个方案有两个缺点,首先不能对新生成的repo自动做镜像,必须手工在Mirror server上运行mirror clone的命令,而且,当版本库的数量增加时,频繁的连接server做update,对server的性能有很大影响。
gitolite有一套master-slave的mirror机制,master每收到一个提交,就会对每个slave做git push --mirror操作。这个方案也有弱点。如果slave重启或者暂时down机,它就会错过这个期间master推送过来的更新。管理员必须对mirror server上每个repository手工运行"git remote update"。而且,必须在gitolite的配置文件中严格定义master/slave,不能随时指定任一台机器进行mirror备份。如果要指定两台server分别保存几个git版本库,并且两台机器互做备份,而不是传统意义上的一台是主server另一台只做mirrror备份,配置起来就更加麻烦。
grokmirror是镜像(mirror)kernel.org上repositories的工具,(grok is a mirror of korg),它允许世界上任何人的任何机器对kernel.org做镜像,而且更新方式也非常有效:通过一个静态文件Manifest.js.gz,server上有任何更新,都会将更新的时间戳写入这个manifest文件。mirror server持续不断的获取server的这个清单文件,并与本地的镜像做对比,如果发现更新,就对相应的git镜像库做git remote update。
安装grokmirror
1.获取grokmirror源码https://git.kernel.org/cgit/utils/grokmirror/grokmirror.gi