前提条件说明:impala已打通hive元数据,测试表格式为parquet
建表性能测试
一、impala
建表SQL
create table temp.ad_impala stored as parquet as select ymd,username,udid,result,requesttime,positions,logid,productname,systemname from ods.bdl_bigdata_online_ad where ymd>=calc_date(4);

- 1亿多条数据,耗时28s
二、hive测试
建表SQL
create table temp.ad_hive stored as parquet as select ymd,username,udid,result,requesttime,positions,logid,productname,systemname from ods.bdl_bigdata_online_ad where ymd>=date_sub(current_date(),4);

同数据量情况下,耗时134s

2万+

被折叠的 条评论
为什么被折叠?



