KingbaseE中的并行查询

金仓数据库

于 2021-11-18 18:16:25 发布

阅读量879

点赞数

文章标签：数据库 java 并行查询 JOIN 性能调优

本文链接：https://blog.csdn.net/Kingbase_/article/details/121406993

版权

概述当前 CPU 具有大量内核，应用程序一直在与数据库并行发送查询。在报告查询处理多表行的情况下，查询使用多个 CPU 的能力有助于我们更快地执行。KingbaseES 中的并行查询允许利用多 CPU 更快地完成报告查询。测试环境数据准备，建立大表，可以很好体现并行查询的差异。kingbase=# \d+关联列表架构模式 | 名称 | 类型 | 拥有者 | 大小 | 描述----------±----------------.

摘要由CSDN通过智能技术生成

概述
当前 CPU 具有大量内核，应用程序一直在与数据库并行发送查询。在报告查询处理多表行的情况下，查询使用多个 CPU 的能力有助于我们更快地执行。KingbaseES 中的并行查询允许利用多 CPU 更快地完成报告查询。
测试环境
数据准备，建立大表，可以很好体现并行查询的差异。
kingbase=# \d+
关联列表
架构模式 | 名称 | 类型 | 拥有者 | 大小 | 描述
----------±-----------------------------±-------±---------±-----------±-----
public | BUSINESS_WHGL_whid_SEQ | 序列数 | system | 8192 bytes |
public | business_wf_file | 数据表 | system | 17 MB |
public | business_wf_file_id_seq | 序列数 | system | 8192 bytes |
public | business_wf_lcsl | 数据表 | system | 2440 kB |
public | business_wf_lcsl_lcsl_id_seq | 序列数 | system | 8192 bytes |
public | business_whgl | 数据表 | system | 16 kB |
public | jbpm4_hist_task | 数据表 | system | 191 MB |

并行顺序扫描
这可能更快不是因为并行读取，而是因为数据分散在许多 CPU 内核上。现代操作系统为 PostgreSQL 数据文件提供了良好的缓存。预读允许从存储中获取一个块，而不仅仅是 KES 守护进程请求的块。因此，查询性能不受磁盘 IO 限制。它消耗 CPU 周期用于：

 从表数据页中一一读取行
 比较行值和 WHERE 条件

让我们尝试执行简单的选择查询：

kingbase=# explain analyze select supertask_ as sum_qty from jbpm4_hist_task;
QUERY PLAN

Seq Scan on jbpm4_hist_task (cost=0.00…36702.12 rows=1230512 width=7) (actual time=0.061…223.064 rows=1230512 loops=1)
Planning Time: 0.040 ms
Execution Time: 255.468 ms
(3 行记录)

顺序扫描产生太多没有聚合的行。因此，查询由单个 CPU 内核执行。

添加 SUM() 后，很明显可以看到两个 worker 将帮助我们更快地进行查询：
kingbase=# explain analyze select sum(supertask_) as sum_qty from jbpm4_hist_task;
QUERY PLAN

Finalize Aggregate (cost=31806.14…31806.15 rows=1 width=32) (actual time=116.894…117.734 rows=1 loops=1)
-> Gather (cost=31805.92…31806.13 rows=2 width=32) (actual time=116.783…117.720 rows=3 loops=1)
Workers Planned: 2
Workers Launched: 2
-> Partial Aggregate (cost=30805.92…30805.93 rows=1 width=32) (actual time=114.408…114.409 rows=1 loops=3)
-> Parallel Seq Scan on jbpm4_hist_task (cost=0.00…2952

最低0.47元/天解锁文章

金仓数据库

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
KingbaseE中的并行查询

概述当前 CPU 具有大量内核，应用程序一直在与数据库并行发送查询。在报告查询处理多表行的情况下，查询使用多个 CPU 的能力有助于我们更快地执行。KingbaseES 中的并行查询允许利用多 CPU 更快地完成报告查询。测试环境数据准备，建立大表，可以很好体现并行查询的差异。kingbase=# \d+关联列表架构模式 | 名称 | 类型 | 拥有者 | 大小 | 描述----------±----------------.
复制链接

扫一扫