1.1
RHEL7
启动
cgroup
报错
问题现象
RHEL7
启动
cgroup
报错
Filed to start cgconfig.service:Unit not found
。
处理步骤
步骤 1
检查以下安装包是否安装,如缺少请安装。
libcgroup-0.41-8.el7.x86_64.rpm
libcgroup-tools-0.41-8.el7.x86_64.rpm
步骤 2
安装后设置 cgroup 服务开机启动。
systemctl enable cgconfig.service
步骤 3
启动 cgconfig 服务:
systemctl start cgconfig.service
1.2
RHEL7
安装
rpm
后,
service
命令启动报错
问题现象
RHEL7
安装
rpm
后,
service
命令启动报错
Unit not found
。
处理步骤
步骤 1
检查
rpm
包是否已经安装。
步骤 2
RHEL7 之后的版本 service 需要手动设置。
GBase 8a MPP Cluster FAQ FAQ
文档版本(2021-04-02) 南大通用数据技术股份有限公司
11
systemctl enable XXXX.service
步骤 3
正常使用
service
。
1.3
服务器路由变更无法执行
sql
问题现象
服务器路由变更导致集群节点无法接收
sql
任务:某个服务器(
ip
为
45
的节点)重
启后,
gcadmin
和数据同步均正常,各
event
均为
0
。但是执行语句时报该节点查询
返回失败,且该节点的
gnGnode
层
show processlist
显示没有集群层下发的语句进
来。
express
日志报错:
gns_host:10.174.20.32 can't get datasession:Failed to connect to:10.174.18.45,
Details:last_errno:2003(failed to connect to host)
原因分析
通过
route
检查路由列表发现该节点重启后
default
路由变成了非集群
IP
所用的路
由。
#route
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
10.174.18.0 * 255.255.255.0 U
0 0 0 bond1
10.174.64.0 *
255.255.255.0 U
0 0 0 bond0
link-local *
255.255.0.0 U
1008 0 0 bond0
link-local *
255.255.0.0 U 1009 0 0 bond1
default
10.174.64.254 0.0.0.0
UG 0 0 0 bond0
处理方法
执行
route del
删除和
route add
新增更换路由得以处理,同时建议系统维护厂商将
正确路由和网关写入配置文件让其长期有效。
修改命令:
route del -net 10.174.64.0 netmask 255.255.255.0 dev bond0
route del default gw 10.174.64.254
route add default gw 10.174.18.1
示例
GBase 8a MPP Cluster FAQ
#route
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
10.174.18.0 * 255.255.255.0 U 0
0 0 bond1
link-local *
255.255.0.0 U 1002 0 0 eth0
link-local *
255.255.0.0 U 1009 0 0 bond1
1.0.0.0
*
255.0.0.0
U 0 0 0 eth0
default
10.174.18.1 0.0.0.0 UG 0 0 0 bond1