optimizer
Greenplum中有两个优化器,一个是Postgres query optimizer(Postgresql自带的优化器,简称PQO),一个是GPORCA(Greenplum自己开发的新一代优化器,简称GPO)。其中GPO在某些方面进行了优化,让其更适合在大数据量的进行数据分析,性能会更好。但是在数据量不是特别大的情况下,两种优化器的差异不是特别大,甚至PQO的性能还要好于GPO。如果Greenplum要频繁对数据进行DML操作,建议使用PQO。
设置optimizer
为一个系统配置optimizer
以gpadmin用户进行操作,配置好optimizer后需要重启数据库.
[gpadmin@gpdb01 ~]$ gpconfig -c optimizer -v on
[gpadmin@gpdb01 ~]$ gpstop -u ###不重启数据库服务,重新加载postgresql.conf,pg_hba.conf等配置文件,但是在Greenplum 6.5.0当中貌似不起作用
[gpadmin@gpdb01 ~]$ gpstop
[gpadmin@gpdb01 ~]$ gpstart
为一个数据库配置optimizer
使用alter命令设置optimizer,这种方式好在不需要重启数据库服务。
gpdb=# ALTER DATABASE test_db SET OPTIMIZER = ON;为一个数据库配置optimizer
为一个用户配置optimizer
使用alter命令设置optimizer,这种方式好在不需要重启数据库服务。
gpdb=# ALTER ROLE gpadmin SET OPTIMIZER = ON;
为一个会话设置optimizer
可以使用SET命令为一个会话设置optimizer。例如,在使用psql工具连接到Greenplum数据库之后,这个SET命令启用GPORCA。
gpdb=# set optimizer = on;
enable_seqscan
GP中查询是否走索引,是比较cost值的,绝大部分场景优化器的cost值的判断是准的,所以,优化器判断走索引消耗比顺序扫描更慢,就不会走索引,优化器判断并不是百分百正确,实际执行效果走索引确实比顺序扫描快的话,可以在会话级别(或者用户级别)设置顺序扫描参数关闭,再执行sql;
为一个数据库配置enable_seqscan
使用alter命令设置enable_seqscan ,这种方式好在不需要重启数据库服务。
gpdb=# ALTER DATABASE test_db SET enable_seqscan = off;为一个数据库配置enable_seqscan
为一个用户配置enable_seqscan
使用alter命令设置enable_seqscan ,这种方式好在不需要重启数据库服务。
gpdb=# ALTER ROLE gpadmin SET enable_seqscan = off;
为一个会话设置enable_seqscan
可以使用SET命令为一个会话设置enable_seqscan 。例如,在使用psql工具连接到Greenplum数据库之后,这个SET命令启用GPORCA。
gpdb=# set enable_seqscan = off;