MogDB/openGauss 故障排查思路

点击上方"蓝字"

关注我们,享更多干货!

前提

当我们收到反馈说数据库响应慢或者压测过程中数据库有报错,第一步先收集数据库服务器资源使用情况,这一步是处理所有故障的前提。

--负载
top 命令
htop 命令

--cpu
lscpu 命令

--内存大小
free -g

--磁盘大小
df-Th 

--磁盘使用跟踪
nohup iostat -xmt 1 > iostat.log 2>&1 &

--网络延时
应用程序与数据库之间的网络延时,集群内主库与同步备库之间的网络延时
nohup ping 目标ip | awk '{ print $0"\t" strftime("%Y-%m-%d %H:%M:%S",systime())}' > ping.log 2>&1 &

*模拟网络延时小知识*

模拟同城机房网络延迟在0.7ms ~ 0.9ms ;

添加网络延迟模拟:tc qdisc add dev enp23s0f1(网卡) root netem delay 0.8ms 0.1ms ;

删除网络延时模拟:tc qdisc dev dev enp23s0f1(网卡) root netem delay 0.8ms 0.1ms。

常见问题

一.Xlog目录磁盘空间不足

Xlog日志目录满的原因有以下几个:

  • 集群内有宕机的备节点,或者主备节点之间的网络不通;

  • 无效的复制槽未及时清理;

  • 开启归档,但归档失败;

  • Xlog保留数量过多。

备节点故障:

通过网络及数据库日志信息,判断节点故障原因,并尽快恢复主备节点之间的复制关系,当故障无法快速解决时,建议修改数据库参数来改变主库Xlog保留大小。

enable_xlog_prune = on
max_size_for_xlog_prune:默认是2T,建议修改值为104857600 (100GB),或根据磁盘空间自行调整
无效复制槽:

查看是否存在无效的复制槽导致Xlog清理不及时,需要将延时最大的复制槽删除。

--查看复制槽
select slot_name,coalesce(plugin,'_') as pl
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值