背景:接入一个文件有10列,但是有用的可能就4列,多的字段入库影响速度,又占用空间,gbase支持入库时过滤,如下。
1.有一个表有2列。phone,imsi
2.文件有4列,“|”分割
3.执行入库命令
load data infile 'ftp://noas:87HEBq@192.168。1.1/data/data/temp/test.txt' into table test.jiangwen_test FIELDS TERMINATED BY '|' ENCLOSED BY '"' table_fields 'phone,imsi,a,b';
不需要导入的字段随便起个名就可以,别是表的字段名就行这样就达到了过滤的效果