【GreenPlum节点异常分析】

Xc531

已于 2024-09-06 16:37:52 修改

阅读量1.1k

点赞数 7

文章标签： postgresql

于 2024-07-24 10:20:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Xc531/article/details/140654642

版权

发生场景：
2024年7月9日 8:34，邮件收到GreenPlum数据库部分数据节点down掉的GPCC监控报警。

处理方式：
1、通过执行 gpstate -m ，显示镜像实例同步状态。

Data Status若为Synchronized，表示主备上的数据都是最新的。

Data Status若为Synchroning，表示节点实例正在同步数据中。

下图中可见Data Status为Not In Sync，表明此mirror节点已被激活。

2、通过执行 gpstate -c，显示主镜像映射，记录该mirror节点对应的primary节点目录

3、执行数据库自带恢复工具 gprecoverseg，执行 gprecoverseg -r ，进行节点数据重平衡，节点成功恢复正常，耗时10min。

原因分析：
1、排查主节点相关日志，发现8:17分左右，日志报错连接数不够。

2、查看上述记录的primary节点日志，发现该时期也在报连接数不够的异常。

3、查看GPCC通知报错，发现8:26分segment_2宕机了，执行 gpstate -s 查看 segment_2 对应的目录日志，发现在报连接数不足后，一个数据库自身的数据同步的 copy 操作因为无法开启事务而发生异常，导致该节点宕机。报错日志如下：

结论：节点宕机的原因是子节点连接数过多，导致数据库主从同步事务(COPY)无法正常建立连接，最终子节点宕机。

为防止再次发生，执行以下措施：

调整 max_connections 的参数值，将子节点的连接数从2500增加至3000。

博客等级

码龄5年

3
原创

46
点赞

41
收藏

39
粉丝

关注

私信

热门文章

最新评论

【Oracle表空间不足报警】
CSDN-Ada助手: 恭喜您开始了博客创作，这是一个很好的开始！对于Oracle表空间不足报警这个话题，您已经很好地展示了问题的重要性和解决方法。接下来，建议您可以尝试深入挖掘Oracle数据库的其他常见问题和解决方案，或者分享一些实用的技巧和经验，让更多的读者受益。期待您更多精彩的博客作品！祝您创作顺利，再接再厉！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。