问题现象
8512 版本 8a 集群,在经分类项目中遇到一旦出现某个节点 Offline 后,整体集群
性能下降严重问题。offline 节点的计算任务转移到同 SG 的另一个节点,导致计
算资源不足而导致性能成倍下降;
8611 版本开始支持多分片,即一个 data node 上存储多个主分片数据,理论上可
以解决单个节点 offline 后,整体集群性能严重下降问题;但某项目测试过程中发
现,在单节点两个主分片情况下,offline 一个节点后,性能下降 3 倍以上,远低
于 1 个主分片时性能下降 60%的表现。
解决方法
该问题的原因,是由于 gnode 层的 gbase_parallel_max_thread_in_pool、gbase_par
allel_degree 两个参数采用默认配置,造成少量 sql 下发后,cpu 资源即被占用完。
该情况下,可调小 gbase_parallel_degree,调大 gbase_parallel_max_thread_in_pool
参数。