了解更多Greenplum相关内容,欢迎访问Greenplum中文社区网站
背景
最近来自中兴通讯的系统架构师、敏捷教练王爱军在工作过程中,遇到gp5.20通过 gprecoverseg -F做全量恢复失败的异常。master和primary的pg_log日志中打印internal error,然后primary crash。本文分享问题的定位过程以及涉及到相关概念,供大家学习参考。
一、问题现象
1.1 集群状态查看
[gpadmin@instance-eqmn04jr pg_log]$ gpstate -s
图1 Mirror Down
1.2 全量恢复
[gpadmin@instance-eqmn04jr pg_log]$ gprecoverseg -F
图2 gprecoverseg失败