第6章gp_toolkit管理架构-Checking for Uneven Data Distribution

Checking for Uneven Data Distribution

Greenplum数据库中的所有表格都是分布式的,这意味着它们的数据被划分到系统中的所有段中。 如果数据分布不均匀,则查询处理性能可能会受到影响。 以下视图可以帮助诊断表格是否具有不均匀的数据分布:

•    gp_skew_coefficients

•    gp_skew_idle_fractions

gp_skew_coefficients

该视图通过计算每个段上存储的数据的变化系数(CV)来显示数据分布偏斜。 所有用户都可以访问此视图,但是非超级用户只能查看他们有权访问的表

Table 130: gp_skew_coefficients view

Column

描述

skcoid

表的对象ID。

skcnamespace

表中定义的名称空间。

skcrelname

表名。

skccoeff

变异系数(CV)以标准偏差除以平均值计算。 它考虑了数据序列平均值附近的平均值和可变性。 数值越低越好。 较高的值表示更大的数据倾斜。


 


 

gp_skew_idle_fractions

该视图通过计算在表扫描期间空闲的系统的百分比来显示数据分布倾斜,这是处理数据倾斜的指示符。 所有用户都可以访问此视图,但是非超级用户只能查看他们有权访问的表

Table 131: gp_skew_idle_fractions view

Column

描述

sifoid

表的对象ID。

sifnamespace

表中定义的名称空间。

sifrelname

表名。

siffraction

表扫描期间空闲的系统的百分比,这是数据分布不均或查询处理偏斜的指标。 例如,0.1的值表示10%的歪斜,0.5的值表示50%的歪斜,等等。 超过10%偏差的表应该评估其分配政策。


 



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值