1.集群配置
3台 fe与3台be混合部署在一台机器上
2.发生背景
发现生成集群的CPU和内存使用出现瓶颈,在测试环境模拟新增一台CN节点,再操作过程中rm -rf错误删除到第一台starrocks上,中间过程取消了命令
3.导致的影响,查询数据报错
很明显是因为数据被删除了
4.修复过程
将fe,be下线报错,有一些表需要3个副本不能下线,先增加了一台fe和be,然后再执行下线
整体修复进度查看
5.优先修复导致业务报错的表
ADMIN REPAIR TABLE dws.dws_trade_symbol_1mo_target_1d;
ADMIN REPAIR TABLE dws.dws_trade_symbol_1mo_target_1d PARTITION (p20221201);
ADMIN SHOW REPLICA STATUS from dws.dws_trade_symbol_1mo_target_1d
show tablet 197645