摘要
Hive内部提供了很多内置函数,括关系运算函数,数学运算函数,逻辑运算函数,数值计算函数,日期函数,条件函数,字符串函数等等,下面我们来一起看看吧。
关系运算函数
1.等值比较:=
语法: A=B
操作类型: 所有基本类型,Synonyms: ==
描述: 如果表达式A与表达式B相等,则为TRUE;否则为FALSE
hive> select 1=1;
true
> < >= <= != <> 类似,这里就不一一列举
2.逻辑非 !
语法: ! A
操作类型: 所有基本类型,Synonyms: not
描述: Logical not
hive> select !1=2;
true
3.空值判断 IS NULL / IS NOT NULL
语法: A IS [NOT] NULL
操作类型: 所有类型
描述: 如果表达式A的值为NULL,则为TRUE;否则为FALSE
hive> select 1 is [not] null;
true
4.LIKE比较: LIKE
语法: A LIKE B
操作类型: strings
描述: 如果字符串A或者字符串B为NULL,则返回NULL;如果字符串A符合表达式B 的正则语法,则为TRUE;否则为FALSE。B中字符”_”表示任意单个字符,而字符”%”表示任意数量的字符。
hive> select * from X where 'football' like 'y%';
year
yes
hive> select * from X where 'football' like 'y__';
yes
注意:否定比较时候用NOT A LIKE B
hive> select not 1 like 2;
true
5、JAVA的LIKE操作: RLIKE
语法: A RLIKE B
操作类型: strings
描述: 如果字符串A或者字符串B为NULL,则返回NULL;如果字符串A符合JAVA正则表达式B的正则语法,则为TRUE;否则为FALSE。
hive> select 'footbar’ rlike '^f.*r$’;
true
注意:判断一个字符串是否全为数字:
hive>select '123456' rlike '^\\d+$';
true
hive> select '123456aa' rlike '^\\d+$';
false
6、REGEXP操作: REGEXP
语法: A REGEXP B
操作类型: strings
描述: 功能与RLIKE相同
hive> select 'footbar' REGEXP '^f.*r$';
true
数学运算函数
1、加法操作: +
语法: A + B
操作类型: 所有数值类型
说明: 返回A与B相加的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。比如,int + int 一般结果为int类型,而 int + double 一般结果为double类型
hive> select 1 + 9;
10
hive> create table log as select 1 + 1.2;
hive> describe log;
_c0 double
2、减法操作: -
语法: A – B
操作类型: 所有数值类型
说明: 返回A与B相减的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。比如,int – int 一般结果为int类型,而 int – double 一般结果为double类型
hive> select 10 – 5;
5
hive> create table log as select 5.6 – 4;
hive> describe log;
_c0 double
3、乘法操作: *
语法: A * B
操作类型: 所有数值类型
说明: 返回A与B相乘的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。注意,如果A乘以B的结果超过默认结果类型的数值范围,则需要通过cast将结果转换成范围更大的数值类型
hive> select 40 * 5;
200
4、除法操作: /
语法: A / B
操作类型: 所有数值类型
说明: 返回A除以B的结果。结果的数值类型为double
hive> select 40 / 5;
8.0
注意:hive中最高精度的数据类型是double,只精确到小数点后16位,在做除法运算的时候要特别注意
hive>select ceil(28.0/6.999999999999999999999);
结果为4
hive>select ceil(28.0/6.99999999999999);
结果为5
5、取余操作: %
语法: A % B
操作类型: 所有数值类型
说明: 返回A除以B的余数。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。
hive> select 41 % 5;
1
hive> select 8.4 % 4;
0.40000000000000036
<strong>注意</strong>:精度在hive中是个很大的问题,类似这样的操作最好通过round指定精度
hive> select round(8.4 % 4 , 2);
0.4
6、位与操作: &
语法: A & B
操作类型: 所有数值类型
说明: 返回A和B按位进行与操作的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。
hive> select 4 & 8;
0
hive> select 6 & 4;
4
7、位或操作: |
语法: A | B
操作类型: 所有数值类型
说明: 返回A和B按位进行或操作的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。
hive> select 4 | 8;
12
hive> select 6 | 8;
14
8、位异或操作: ^
语法: A ^ B
操作类型: 所有数值类型
说明: 返回A和B按位进行异或操作的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。
hive> select 4 ^ 8;
12
hive> select 6 ^ 4;
2
9.位取反操作: ~
语法: ~A
操作类型: 所有数值类型
说明: 返回A按位取反操作的结果。结果的数值类型等于A的类型。
hive> select ~6;
-7
hive> select ~4;
-5
逻辑运算函数
1、逻辑与操作: AND
语法: A AND B
操作类型: boolean
说明: 如果A和B均为TRUE,则为TRUE;否则为FALSE。如果A为NULL或B为NULL,则为NULL
hive> select 1=1 and 2=2;
true
2、逻辑或操作: OR
语法: A OR B
操作类型: boolean
说明: 如果A为TRUE,或者B为TRUE,或者A和B均为TRUE,则为TRUE;否则为FALSE
hive> select 1=2 or 2=2;
true
3、逻辑非操作: NOT
语法: NOT A
操作类型: boolean
说明: 如果A为FALSE,或者A为NULL,则为TRUE;否则为FALSE
hive> select not 1=2;
true
数值计算函数
1、取整函数: round
语法: round(double a)
返回值: BIGINT
说明: 返回double类型的整数值部分 (遵循四舍五入)
hive> select round(3.1415926);
3
hive> select round(3.5);
4
hive> create table log as select round(9542.158);
hive> describe log;
_c0 bigint
2、指定精度取整函数: round
语法: round(double a, int d)