Hive之企业级参数优化

3. 使用Vectorization

Vectorized查询执行会提高操作性能,例如scans、aggregations、filters和joins,通过一次执行1024行提高性能。

该属性在hive 0.13版本引入,该属性能够提高查询执行的时间。

通过设置以下两个参数:

[code language=”SQL”]

set hive.vectorized.execution.enabled = true;

set hive.vectorized.execution.reduce.enabled = true;

[/code]

 

set hive.vectorized.execution.enabled=false;
默认关闭,开启后,每次处理数据时会将1024行数据组成一个batch进行处理,而不是一行一行进行处理,这样能够显著提高执行速度。
支持的操作过程有:
1.arithmetic: +, -, *, /, %
2.AND, OR, NOT
3.comparisons <, >, <=, >=, =, !=, BETWEEN, IN (list-of-constants ) as filters
4.Boolean-valued expressions (non-filters) using AND, OR, NOT, <,>, <=, >=, =, !=
5.IS [NOT] NULL
6.all math functions (SIN, LOG, etc.)
7.string functions SUBSTR, CONCAT, TRIM, LTRIM, RTRIM, LOWER, UPPER,LENGT

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值