了解更多Greenplum相关内容,欢迎访问Greenplum中文社区网站
统计数据是描述存储在数据库中的数据的元数据,查询规划器需要最新的统计信息来为查询选择最佳的执行计划。通过执行analyze语句收集和更新统计信息。最近遇到gp5.x通过analyze收集统计信息慢、集群性能下降的现象。本文将分享统计信息收集的优化过程以及涉及到相关概念。
1. 问题说明
复现analyze AO表的效率低,实验的软硬件情况如下:
条目 |
说明 |
云服务器 |
2核/2GB/50GB SSD/密集计算型ic4 |
操作系统 |
CentOS / 8.2 x86_64 (64bit) |
Greenplum5.24 |
逻辑集群,master/standby和3primary/3mirror |
表1实验环境
1.1 创建AO列存分区表
1)建表语句
图1 建表
2)表中记录数
图2 表记录
1.2 耗时和资源占用
1)在基表上执行统计信息收集