修改Greenplum表存储和分布策略

修改Greenplum表存储和分布策略

修改表是DBA最频繁的操作之一。Greenplum利用多种存储机制实现大数据量存储和处理,包括数据分布、分区、堆表、AO表、压缩、外部表等。

本文介绍如何在创建表之后修改表存储和分布策略。修改表命令改变表的定义,使用ALTER TABLE改变表的属性,如列定义、分布策略,存储模式、分区结构。
如增加列的非空约束。示例:ALTER TABLE sachi ALTER COLUMN name SET NOT NULL;

1. 修改分布策略

ALTER TABLE 提供选项改变表的分布策略。当表分布选项改变时,表数据在磁盘上被重新分布属于资源密集操作。还可以使用现有的分发策略重新分发表数据。

对于分区表,改变分布策略会递归应用到所有子分区,该操作保留所有者和表所有其他属性。举例,下面命令重新分布sales表:

ALTER TABLE sales SET DISTRIBUTED BY (customer_id);

当hash分布表的分布键修改时,表数据会自动重新分布。但修改分布策略为随机分布时不会引起重新分布,举例:

ALTER TABLE sales SET DISTRIBUTED RANDOMLY;

为了重新分布表数据(针对随机分布策略或hash分布策略没有改变)使用REORGANIZE=TRUE。重新分布数据可解决数据倾斜问题,或有新的段资源加入系统。举例:下面命令重新分布表所有段的数据,使用当前分布策略,包括随机分布。

ALTER TABLE sales SET WITH (REORGANIZE=TRUE);

2. 修改存储策略

表存储、压缩、存储方向(按行、列)仅能在创建时指定。为了改变存储模式,你必须先创建表使用正确的存储选项,然后从原表中加载数据至新表,接着删除原表并修改新表名称为原表名称。当然你必须要有相应权限。举例:

CREATE TABLE sales2 (LIKE sales) WITH (appendonly=true, compresstype=quicklz, compresslevel=5, orientation=column);
INSERT INTO sales2 SELECT * FROM sales;
DROP TABLE sales;
ALTER TABLE sales2 RENAME TO sales;
GRANT ALL PRIVILEGES ON sales TO admin;
GRANT SELECT ON sales TO guest;

ALTER TABLE 命令增加压缩列:

ALTER TABLE test_tab ADD COLUMN new_cmp_fld int DEFAULT 0 ENCODING (COMPRESSTYPE=zlib);

3. 总结

本文介绍了Greenplum如何修改表的存储方式和分布策略,良好的存储和分布策略可以提升系统性能。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值