最近需要使用分布式数据库Hive管理日志数据,原始日志数据使用欧元符号€作为字段分隔符,如下图所示,创建hive表的时候就想指定€作为分隔符,这样就可以不用改变原始日志数据而直接导入hive中。
我就写了如下hive QL创建表,
CREATE TABLE subscription (RowNum BIGINT, UserNum BIGINT, Province STRING, City STRING, PayTime TIMESTAMP, PayType SMALLINT, PayID STRING, PayAmount DOUBLE, ContentPayType SMALLINT, PayContentID STRING, PayMethodType SMALLINT, ClientVersion STRING) clustered by(PayTime) into 32 buckets row format delimited fields terminated by '€' stored as textfile;
成功执行完下面sql语句后,高兴的以为成功导入了,
Load data local inpath'/media/172.16.46.6/changbiao/server/a_10000_*_VGOP1-R2.10-21201_*_*.dat.gz'into table subscription; <