创建对应YAML文件
创建对应YAML文件
VERSION: 1.0.0.1 # 默认不修改
DATABASE: postgres # 对应入库的数据库名
USER: gpadmin # 通常都是gpadmin
HOST: 127.0.0.1 # Greenplum Master IP地址
PORT: 5432 # Greenplum Master 端口号
GPLOAD:
INPUT:
- SOURCE:
LOCAL_HOSTNAME:
- localhost # 当前安装了gpload客户端的主机IP
PORT: 22222 # gpload启动使用的端口
FILE:
- /home/gpadmin/test.csv # csv文件绝对路径
- COLUMNS:
- ID: int # 对应外部表的数据类型,通常和数据库内部表一样
- NAME: text # 对应外部表的数据类型,通常和数据库内部表一样
- CUST_ID: text # 对应外部表的数据类型,通常和数据库内部表一样
- FORMAT: csv # 格式
- DELIMITER: '|' # csv文件分隔符
- QUOTE: '"' # 字符串逃逸符
- HEADER: false # csv不带表头,默认第一行不忽略
-ENCODING: UTF-8 #如果数据文件个别存在导入后乱码,可以针对个别设置编码
- ERROR_LIMIT: 50 # 错误上线,达到50后执行失败
- LOG_ERRORS: true # 存储入库错误
OUTPUT: # 数据库内部表的映射关系
- TABLE: t1 # 内部表名字
- MODE: INSERT # 插入方式入库
- MAPPING:
ID: ID # 映射,前面是内部表字段,后面是映射的字段,后面的字段可以是外部表的字段或数据库函数
NAME: NAME
CUST_ID: CUST_ID
CREATE_TIME: now()
PRELOAD:
- TRUNCATE:true
- REUSE_TABLES: false # 默认外部表不重用