GlusterFs分布式复本卷服务器替换实践

最新推荐文章于 2024-07-23 13:59:24 发布

zzulp

最新推荐文章于 2024-07-23 13:59:24 发布

阅读量4.8k

点赞数

分类专栏：杂项

本文链接：https://blog.csdn.net/zzulp/article/details/46712967

版权

出于存储安全的需要，近期新建了一个分布式复本卷来存储一些重要数据。服务器从gfserver20-29，然而使用没几天，一台服务器gfserver26的操作系统就崩溃了，一执行命令就报I/O error，应该是硬盘挂掉了。运维的同事帮忙更换了硬盘了，重新安装了操作系统。不幸的是复本卷的数据也被格式化了。幸好这个卷是复本卷，新的设备上线之后，可以重新进入集群，并恢复成原貌。这就是复本卷的优势。

下面记录一下恢复过程遇到的问题，方便下次遇到查询。

一将设备重新加入集群

Gluster采用UUID来标识每个gluster实例，这个信息存储在/var/lib/glusterd/glusterd.info中，因此只要恢复之前的UUID，好么Gluster集群就认为其和原来是同一设备。当然最好主机名和IP与原来一样，当然不一样也完全没有关系。

在一台服务器上如gfserver20上查看gfserver26的历史UUID：grep gfserver26 /var/lib/glusterd/peers/*，记录下UUID的历史值。
在gfserver26上，修改/var/lib/glusterd/glusterd.info的UUID为其历史值。重启glusterd进程。
执行gluster peer probe gfserver20。重启后，正常情况就能同步到集群的peer信息。但我在执行中遇到了无法peer信息，在其他服务器上查看peer status时显示gfserver26状态为rejected。其解决方法是删除/var/lib/glusterd/目录下除glusterd.info文件的其他文件，然后重启glus