问题现象
现场进行多个 insert...select 的操作,多个任务一起操作的时候,insert 后跟对应的字段名,执行插入后报错 get cluster task id fail。
问题排查
(1)排查gcware 日志得到报错:
corosync [IPC ]coroipcs create thread error with errno 11
(2)排查dmesg 日志得到报错:
[1871111.282609] cgroup: fork rejected by pids controller in /system.slice/gc ware.service
[2222469.222555] cgroup: fork rejected by pids controller in /system.slice/gc ware.service
[2414924.406356] cgroup: fork rejected by pids controller in /system.slice/mo nit.service
问题分析
根据如上报错分析,'fork rejected by pids controller' 说明对进程数是有限制的。最终原因是因为在 SUSE 12 上增加了 systemd 的资源控制,其中默认参数:
DefaultTasksMax was default value(512).
systemd limited maximum number of tasks that may be created in the unit.
这个值会影响 OS 上的 maxpid。
解决方案
将参数 DefaultTasksMax 设为无限制后解决该问题:
修改/etc/systemd/system.conf
设置 DefaultTasksMax 的值为'infinity',重启主机。
补充说明
这个问题原因在于 R7 或是 S12 系列,使用了 systemd,在 R6 或 S11 上没有,当这个启动后,忽略掉/etc/security/limits.conf 下的设置。
DefaultTasksMax 参数(默认 512)需要放在/etc/systemd/system.conf中,我们可以安装集群过程中修改该值,但是如果不重启操作系统的话,不会生效,这个属于新版操作系统问题,需要在安装集群前设置生效。