背景:Clickhouse集群中某分片编号为2的副本节点硬盘故障,需要用新机器替换损坏的机器。
(ck版本:22.8.2..11)
操作过程:
1、启用备用的clickhouse机器(11.66.1.96),在机器上部署ck
1)安装CK:rpm -ivh *.rpm
2)从ck集群中与损坏的机器互为副本节点的机器上拷贝配置文件config.xml和users.xml,然后要记得调整数据目录及<macro>
中的宏(特别是replica)。
注意:*默认数据目录最好要与损坏节点的一致,因为CK本身保存数据时metadata和data目录下有特别多软链接。如果一定要放在其他目录,也要自己建软链接等保证CK内部软链接能够访问到数据。
*配置文件和数据目录的权限一定要给clickhouse用户,这点特别重要,否则CK服务会开不起来,且日志中不会有任何提示。
3)开启ck服务,并建本地表等测试ck是否正常,验证完后停止CK服务。
4)ck服务设置为开机启动:service enable clickhouse-server
5)从ck集群其他机器上拷贝/etc/hosts中CK主机映射到备用机器上。
6)确保该节点与ck集群其他节点、zookeeper集群节点网络可通,以便能顺利切换。
=====开始进行Clickhouse节点替换
2、停止CK集群各节点的服务。
3、将备用机器IP与损坏的节点IP互换
1)修改损坏的clickhouse机器IP为11.66.1.40 --随便找个ping不通