GreenPlum中性能调优之数据倾斜

Greenplum的数据分布对其查询效率至关重要,因为系统性能由最弱的segment决定。通过查询gp_toolkit视图可以检查数据偏斜和空闲偏差系数。如果发现数据分布不均,可以使用`ALTERTABLE`语句进行数据重分布或调整分布键以优化性能。
摘要由CSDN通过智能技术生成

数据分布:

greenplum中数据分布情况直接影响到查询的效率,原因是greenplum架构是由性能最差的segment实例决定,所以数据分布不均匀会影响整个集群的性能。

检查数据的偏斜/倾斜情况:

SELECT * FROM gp_toolkit.gp_skew_coefficients WHERE skcrelname = 'table_name'; --查看skccoeff偏差系数
SELECT * FROM gp_toolkit.gp_skew_idle_fractions WHERE skcrelname = 'table_name';--查看空闲偏差系数:越小越好

查看数据分布情况:

select gp_segment_id,count(*) from table_name group by gp_segment_id;

重新平衡表数据:

如果表的分布键合理,直接重分布数据:

alter table table_name set with(reorganize=true);

否则重新调整分布键再执行重分布:

alter table table_name set distributed by (col1,col2...);

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值