1)青梅不是香草型postgres,但类似。它有一些新的语法,但总的来说,是高度一致的。在
2)Greenplum本身提供了一个名为“gpfdist”的东西,它允许您监听指定的端口,以便引入一个文件(但文件必须拆分)。您需要可读的外部表。他们相当快。语法如下:CREATE READABLE EXTERNAL TABLE schema.ext_table
( thing int, thing2 int )
LOCATION (
'gpfdist://server:port1/path/to/filep1.txt',
'gpfdist://server:port2/path/to/filep2.txt',
'gpfdist://server:port3/path/to/filep3.txt'
) FORMAT 'text' (delimiter E'\t' null 'null' escape 'off') ENCODING 'UTF8';
CREATE TEMP TABLE import AS SELECT * FROM schema.ext_table DISTRIBUTED RANDOMLY;
如果你遵守他们的规则,而且你的数据是干净的,那么加载速度会很快。在
3)您不需要python来实现这一点,尽管您可以使用python启动gpfdist进程,然后向psql发送一个命令来创建外部表并加载数据,从而实现自动化。但要看你想做什么。在