kudu集群运行避免不了服务器硬件,软件异常导致宕机。如果宕机的是master节点且服务器不能启动如何恢复master?下面介绍下如何在服务器宕机的情况下迁移master服务。
1. 将每个活着的master uuid 记录下来
命令:
sudo -u kudu kudu fs dump uuid --fs_wal_dir=<master_wal_dir> [--fs_data_dirs=<master_data_dir>] 2>/dev/null
示例:
sudo -u kudu kudu fs dump uuid --fs_wal_dir=/data/data1/kmaster
--fs_data_dirs=/data/data2/kmdata,/data/data3/kmdata,/data/data4/kmdata 2>/dev/null
2. 在活动的master上执行
命令
sudo -u kudu kudu local_replica cmeta print_replica_uuids --fs_wal_dir=<master_data_dir> <tablet_id> 2>/dev/null
示例
$ sudo -u kudu kudu local_replica cmeta print_replica_uuids --fs_wal_dir=/data/kudu