故障现象 :
在使用sys_monitor.sh start启动集群时出现以下故障
问题分析:
对于集群主库vip地址的加载,需要使用arping工具执行arp缓存的清理和ip地址占用的测试,如果arping工具出现版本不兼容及权限问题,将导致在主库加载vip地址失败。
-
查看arping配置(repmgr.conf):
arping_path='/home/kingbase/cluster/R6C5/R6C5R/kingbase/bin'
-
查看arping版本信息:
[kingbase@node101 bin]$ ./arping -V arping utility, iputils-s20210301kb
-
查看arping权限
[kingbase@node1 bin]$ ls -lh arping -rwxr-xr-x 1 kingbase root 11K Nov 5 2021 arping
注意
对于通用机环境arping属主应该是root用户,由于需要kingbase用户可以执行此工具,因此需要增加setuid。
问题解决:
配置arping权限
[root@node3 ~]# cd /home/kingbase/cluster/R6C5/R6C5R//kingbase/bin [root@node3 bin]# chown -R root.root arping [root@node3 bin]# chmod u+s arping [root@node3 bin]# ls -lh arping -rwsr-xr-x 1 root root 11K Nov 5 2021 arping
配置arping权限后,重新执行sys_monitor.sh启动集群,问题解决。
问题总结:
对于kingbaseES集群使用数据库系统自带的arping软件包,一般不会出现版本不兼容的问题;对于arping工具的属主应该是root,不是kingbase用户,但为了kingbase用户也能执行arping,必须配置arping的setuid权限。