使用create table从无到有,按照建表的格式和要求实现建表。实际开发中较常用的方式,主要可以定制化建表。
示例:
CREATE TABLE db_name.ods_mysql_deduct_sign_di(
`sign_no` string COMMENT '签约协议号',
`bp_no` string COMMENT '商户号',
`comments` string COMMENT '备注',
`create_time` string COMMENT '创建时间',
`update_time` string COMMENT '更新时间'
)
COMMENT '代扣签约表'
PARTITIONED BY (`inc_day` string COMMENT '日期分区')
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\001'
STORED AS parquet
tblproperties ('parquet.compression'='snappy')
;
ps:
1)符合表命名标准
2)存储格式:parquet 压缩算法:snappy
说明:Hive三种主流的文件存储格式TEXTFILE 、ORC、PARQUET。
TEXTFILE是行式存储,不可进行压缩存储;ORC和PARQUET是列式存储,可进行压缩存储。ORC和PARQUET主要区别在于ORC压缩率更高,PARQUET支持更广泛的数据类型和更多的数据系统。对于ORC可选择Snappy、Zlib压缩算法, Snappy压缩和解压性能更好,Zlib压缩比更高,需要注意的是Snappy不支持split,对并行计算会有影响;对于Parquet可选择Snappy、 Gzip、 LZO压缩算法,Gzip压缩比更高, Snappy压缩和解压性能更好,兼顾压缩比解压缩性能LZO更好。