统计信息的收集
通过调整 default_statistics_target 的值可以改变样本容量,目前 default_statistics_target 的默认值是 100,
在计算样本容量时,采用 300×defualt_statistics_target=30000 作为采样的样本默认容量。
采样的方式包括:
自动收集
主动收集
自动收集
KingbaseES 会默认自动收集统计信息
autovacuum 会执行 analyze 操作更新统计信息,这些阈值等一系列配置参数保存在 kingbse.conf 里面,主要包括:
1、总控 autovacuum 参数:
autovacuum:
是否允许自动 vacuum,默认值是 on。
log_autovacuum_min_duration:
默认值为-1,不记录 vacuum 日志。0 记录所有 vacuumlog。
正整数,单位为微秒,表示 vacuum 执行时间小于该值的不记录,大于该值的的记录 log。
autovacuum_max_workers:
最大的 autovacuum 进程的数量,默认值为 3。
autovacuum_naptime:
检查数据库的时间间隔。默认为 1 分钟。
2、自动 vacuum 参数:
autovacuum_vacuum_threshold:
激活自动 vaccum 的最小 DML 操作的行数。默认值 50。
autovacuum_vacuum_scale_factor:
该参数采用百分比的方式设定阀值。默认值为 20%。
说明:
表上 update 和 delete 记录总数 >= autovacuum_vacuum_scale_factor * 表上记录数(reltuples)
+ autovacuum_vacuum_threshold 后,触发 vacuum。
3、自动 analyze 参数
autovacuum_analyze_threshold:
激活自动 analyze 操作的最小行数。默认值 50。
autovacuum_analyze_scale_factor:
到达阀值时自动激活 analyze 操作。默认值为 10%。
说明:
表上 insert、update 和 delete 记录总数 >= autovacuum_analyze_scale_factor * 表上记录数
(reltuples)+ autovacuum_analyze_threshold 后,触发自动 analyze。
4、事务 ID 相关参数
autovacuum_freeze_max_age:
为防止事务 ID 的重置,在启用 vacuum 操作之前,表的 sys_class.relfrozenxid 字段的最大值,默认为 2亿。
说明:表上事务的最大年龄配置参数 autovacuum_freeze_max_age,达到这个阀值将触发 autovacuum进程。
3.3.3.2 主动收集
主动收集是指用户通过定时脚本或者人工执行 analyze 命令来进行
是不带参数运行 ANALYZE 会为数据库中所有的表更新统计信息
主动收集统计时机的信息一般为:
装载大量数据后
CREATE INDEX 操作后
在大量更改底层数据的 INSERT、UPDATE 以及 DELETE 操作之后
执行计划的代价估算不准确时