了解更多Greenplum技术干货,欢迎访问Greenplum中文社区网站
Greenplum是一个大规模并行处理数据库,它由一个master和多个segment组成,其数据按照设定的分布策略分布于各个segment上。数据表的单个行会被分配到一个或多个segment上,但是有这么多的segment,它到底会被分到哪个或哪些segment上呢?分布策略会告诉我们。
分布策略
在Greenplum 5中,有2种分布策略:
- 哈希分布
- 随机分布
在Greenplum 6中,添加了另一个策略:
- 哈希分布
- 随机分布
- 复制分布
数据表的单个行会被分配到一个或多个segment上,但是有这么多的segment,它到底会被分到哪个或哪些segment上呢?分布策略会告诉我们。
哈希分布:
要使用这一策略,需要在创建表使用 “DISTRIBUTED BY(column,[