关键字:
集群部署、一键部署、工具部署、问题处理
1.概述
KingbaseES集群部署方式分了工具部署集群和一键部署集群,在集群部署过程中,我们可能会因为各种问题导致部署集群失败,本文会针对常见的几种问题作出简要说明,并且对相应的问题提供解决方式,帮助用户更高效地部署集群。集群部署方式可以参考手册《KingbaseES数据库部署工具使用指南》和《金仓数据守护集群和读写分离集群使用手册》
2.集群部署常见问题及解决方式
- 安装包问题。 KingbaseES集群部署支持不同的环境,其中包括X86、龙芯、飞腾等。在部署集群的时候需要正确选择对应的安装包,否则在安装KingbaseES服务的时候就会失败。
- license问题 在选择了正确的安装包之后,安装过程中需要选择合法的license,否则单机或部署集群时在启动数据库的时候会报license相关的错误。
- 通信问题 工具部署集群时,会依赖sys_securecmdd服务。而在启动sys_securecmdd服务的过程中,我们常常会遇到sys_securecmdd服务初始化失败的情况(特别是在部署过依赖sys_securecmdd服务集群的环境,或则第一次部署失败,需要重新部署的时候)。
根据日志,分析失败原因,可能的原因主要可能会存在如下几点:
a、环境中已经存在sys_securecmdd服务,此时需要使用systemctl stop securecmdd.service停止服务,并且清理对应路径下的相关文件
b、第一次部署集群失败后,已经启动sys_securecmdd服务成功,此情况下可以选择直接使用该服务部署集群,或则按照步骤a中的方式停止服务并且清理文件后重新部署集群
c、工具在初始化sys_securecmdd服务的时候报错,也有可能是因为选择的zip包有误,需要确定使用了正确的zip包
- 启动数据库失败
部署集群过程中,初始化数据库之后启动数据库失败,可能是因为license版本不对,需要确认相关问题。
- 新建节点超时
数据库部署工具中新建节点显示超时的解决办法:
a、进入root用户权限
b、vim /etc/ssh/sshd_config
c、修改
GSSAPIAuthentication为no
UseDNS为no
d、重启ssh服务
systemctl restart sshd.service
集群部署是一个较为复杂的操作,具情况还需根据日志具体分析,本文仅提供了一些简单明了的集群部署失败的解决方式,如果有其他无法解决的问题,请联系专业的技术人员协助解决。 更多信息,参见https://help.kingbase.com.cn/v8/index.html