前言:GP insert,copy 实际是要先走master,再分发至各个segment,占用master各种资源,segment资源又未充分利用,关键是速度又慢;GP的正确玩法应该是 外部表/gpfdist ,直接用segment装载数据。
建立外部表,location到指定的hdfs位置
注意:表字段类型与schema信息需要一致
CREATE EXTERNAL TABLE public.company( |
外部表成功:
前言:GP insert,copy 实际是要先走master,再分发至各个segment,占用master各种资源,segment资源又未充分利用,关键是速度又慢;GP的正确玩法应该是 外部表/gpfdist ,直接用segment装载数据。
建立外部表,location到指定的hdfs位置
注意:表字段类型与schema信息需要一致
CREATE EXTERNAL TABLE public.company( |
外部表成功: