1.在linux下启动gpfdist服务
gpfdist是Greenplum自带的工具,无需安装其他依赖或服务
$ gpfdist -d /u01 -p 5555 -l /tmp/gpfdist.log &
参数解释:
-d 数据文件所放的目录
-p 设置访问gpfdist端口,这个可以根据实际情况写。
-l 设置日志文件所放的目录,这个参数也可以不用填写。
& 必须要写。
查看gpfdist是否开启:ps -ef|grep pfdist
启动前:
启动后:
2.导入数据
2.1创建external table(可读外部表)
=# create external table 外部表名(列名1 数据类型,列名2 数据类型...)LOCATION('gpfdist://服务器IP:gpfdist服务的端口/数据源文件') FORMAT '数据源模式' (HEADER DELEMITER AS ',') log errors into err.test_