目录
总结
hive中 hive create table as select ... 自己制作的表 默认是textfile存储格式 也就是默认不是列式存储
create table tbname as select ... 的hive生成的建表语句:
这一个大坑就是你如果列很多 数据很大 无法实现列下推 即 只获取某几列数据 减少磁盘访问
所以另一种方法就是手动指定存储格式和压缩格式:
TBLPROPERTIES 是 table properties 表属性的缩写
create table db1.tmp1 stored as orc TBLPROPERTIES
('orc.compress'='SNAPPY')
as
select * from db1.tb1