Impala实践之十一:parquet性能测试

本文详述了对Impala使用parquet格式进行的一系列性能测试,包括多个测试用例,对比了parquet和text格式的性能差异,并观察了compute语句对查询效率的影响。测试结果显示parquet在查询速度上有显著优势。
摘要由CSDN通过智能技术生成

前言

之前一直考虑更换impala的文件存储格式为parquet,但是没有立即使用,最近又做了一些测试,看看parquet是否真的有用。在测试的时候顺便测了一下compute语句的效果,一起作为参考。下面抽出一个小业务的部分测试结果来展示。

测试准备

库名和表名当然不是真的。

测试范围:

  • 文件格式:parquet和text
  • compute语句的影响

测试用表:

表名 行数 字段数 物理存储大小
ain 34231137 11 1.4 G
a_in 395857172 11 4.4 G
in 62025197 6 2.5 G
c 4055068 144 708.3 M

测试用例1

这个记录是当时随手测的一个结果。

sql语句:

select count(*) from c;

测试结果:

文件格式 第1次执行耗时 第2次执行耗时
text 7.72s 0.74s
parquet 5.90s 0.53s

测试用例2

sql语句:

select count(uid) from c
where ***
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值