原文链接:https://www.gbase.cn/community/post/4640
更多精彩内容尽在南大通用GBase技术社区,南大通用致力于成为用户最信赖的数据库产品供应商。
南大通用GBase 分布式事务产品数据库,支持单机式、主备式、分布式等多种部署形态。本文主要介绍主备式集群运维过程中经典问题的案例,主要按照环境信息、报错信息、排查思路及解决办法的流程来处理,生产环境需谨慎参考,可联系相关技术人员协同处理。
问题1:
环境说明:500主备环境,安装目录,日志,数据目录都在/home/gbase下,集群中没有配置vip
问题说明:业务反馈主节点数据库连接不上,报error:Unsupported or unrecognized SSL message
排查说明:数据节点日志发现报错 DETAIL: Permissions should be u=rw (0600) or less,排查数据目录权限发现,人为在root用户下执行chmod -R 777 /home(数据库安装在/home/gbase/database下)
问题处理:1)恢复业务:手动进行主备切换,将13.2原主切换到13.3,让业务验证连接13.3,业务反馈正常。
2)修复权限:
find /home/gbase/ -perm 777 -type d | xargs chmod 700
find /home/gbase/ -perm 777 -type f | xargs chmod 600
3)修复app/bin/gs_om,python之类命令权限修复为500
4)修复数据目录下的server.crt和server.key文件权限400
问题2:
需求说明:500主备式数据库配置防火墙策略(默认端口15400为例)
需求处理:
systemctl start firewalld
firewall-cmd --zone=public --add-port=15400/tcp --permanent
firewall-cmd --zone=public --add-port=15300/tcp --permanent
firewall-cmd --zone=public --add-port=15301/tcp --permanent
firewall-cmd --zone=public --add-port=15302/tcp --permanent
firewall-cmd --zone=public --add-port=15405/tcp --permanent
systemctl stop firewalld
systemctl start firewalld
firewall-cmd --zone=public --query-port=15400/tcp
问题3:
环境说明:500主备式数据库
问题说明:修改主机名或者ip会导致数据库报错 xxxx list index out of range
修复说明:1)找到安装的xml,
find / -name *.xml
2)使用sed批量替换原主机名
sed -i 's/原机器名/新机器名/g' /home/opt/gbase_package/cluster_config.xml
3)使用gs_om重新加载配置
--修改hostname
gs_om -t generateconf -X /home/opt/gbase_package/cluster_config.xml --distribute
--修改ip和端口
gs_om -t generateconf --old-values=2345,192.x.x.100 --new-values=15400,192.x.x.100 --distribute
4)重启集群生效
gs_om -t stop; gs_om -t start
原文链接:https://www.gbase.cn/community/post/4640
更多精彩内容尽在南大通用GBase技术社区,南大通用致力于成为用户最信赖的数据库产品供应商。