1 登录GP:通过图形界面的GUI,pgAdmin III。
2 数据分布:Master节点本身不存储数据,所有的数据拆分保存到每一个节点上
分布方式有两种:
指定分布健时,按照分布健的Hash值分布数据为哈希分布,计算Hash值,通过这个值路由到特定的Segment节点,语法为distributed by,如果不指定分布健默认第一个字段为分布健
不指定分布健,数据随机分布到每一个节点为随机或平均分布。但是这样的缺点是执行SQL关联时,要将数据重分布性能很差,语法是distributed randomly
3 为什么查询出的结果是随机的?
GP的数据是放在所有的Segment节点上的,查询的时候,Master的数据展现顺序是Master先接收的先展现,但是每个Segment的数据到达Master的顺序是随机的不是固定的,所以执行的查询结果是随机的。