第一遍看书没太理解分区表,不知道是什么,暂且先这样记吧:
这是在不同segment上数据的分布情况:
#select gp_segment_id,* from lianxi;
91 发展部 11 5200
90 发展部 10 5200
38 发展部 9 4500
43 销售部 4 4800
46 销售部 1 5000
40 发展部 7 4200
39 发展部 8 6000
44 销售部 3 4800
45 私立部 2 3900
42 私立部 5 3500
摘录下其他人的总结:
无论是分区表还是非分区表,通过GP的DISTRIBUTE功能,都会把数据分散到各个SEGMENT上去。
分布,是从物理上把数据分散到各个SEGMENT上,这样更有利于并行查询。
分区,是从逻辑上把一个大表分开,这样可以优化查询性能,分区是不会影响数据在各个SEGMENT上的分布情况的。