Hive不同存储格式占空间比较

2.47G大小结构化文件2642845690

分别在hive

上建表 (默认压缩算法)

在HDFS上对应目录如下图:

将这个文件load进stored as textfile 的表里

stored as textfile  在HDFS上占空间和linux上一样2642845690 约2.47G

stored as orc 从textfile表插入数据花费Time taken: 72.333 seconds

在HDFS上占空间585377591约0.55G

stored as sequencefile 从textfile表插入数据花费Time taken: 58.538 seconds

在HDFS上占空间2823942397约2.63G

stored as parquet  从textfile表插入数据花费Time taken: 89.844 seconds

在HDFS上占空间625366787约0.582G

stored as rcfile 从textfile表插入数据花费Time taken: 55.115 seconds

在HDFS上占空间2513468031约2.34G

结论 占用空间排序sequencefile 〉textfile〉rcfile 〉parquet〉orc

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值