KuduTablet设置维护时间
follower_unavailable_considered_failed_sec
默认为300s,tablet失去联系超过300s后,该节点的数据就会在其他节点重建,为了避免维护造成的不必要的数据移动和拷贝,可以临时设置此时间为更长的时间(重启维护加上tablet重启后初始化需要的时间)
1.健康检查
维护前需要健康检查,如果有任何副本不足的情况,需等待副本拷贝完成后再维护
## sudo -u kudu kudu cluster ksck master-01.example.com,master-02.example.com,master-03.example.com
sudo -u kudu kudu cluster ksck cdh-test-10-9-251-32.lan
2.设置维护时间
目前有Kudu Tablet Server服务的节点如下:
-
cdh-test-10-9-251-30.lan
-
cdh-test-10-9-251-31.lan
-
cdh-test-10-9-251-32.an
-
cdh-test-10-9-251-33.lan
假设需要维护cdh-test-10-9-251-30.an
这个节点为1h
在所有tablet节点上执行
sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 3600
在kudu 1.8以前的版本需要加上--force
参数
sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 3600 --force
3.在kudu web管理页面查看设置是否成功
登录 http://cdh-test-10-9-251-31.lan:8050/varz 查看是否设置成功
4.维护完成后设置成默认值
sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 300 --force
4.生产环境维护步骤
sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 86400 --force
sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 300 --force