hadoop存储测试

目标

测试hadoop常见的几种存储格式textfile、orcfile、parquet、sequencefile占用存储空间以及在hive、impala、presto的查询效率

测试结果

存储格式未压缩压缩后(snappy)impalaprestohive
textfile35G10.1G5s5s47s
orcfile6.2G4.8G不支持2s41s
parquet19.4G5.8G1.6s1s52s
sequencefile41.2G11.4G4s10s61s
总结

在占用存储空间方面,orcfile数据压缩比例最高,其次为parquet,sequencefile比textfile占用空间还要高

在检索效率方面,orcfile与parquet在impala、presto使用差不多,效果都很不错。使用hive的话orcfile比textfile效率要高一些,,parquet比textfile效率还要低


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值