Apache Hive 是一个建立在 Hadoop 之上的数据仓库工具,它提供了一种类 SQL 查询语言(HiveQL)来查询和管理大数据集。Hive 提供了丰富的内置函数,可以用来处理和分析数据。以下是一些常用的 Hive 函数:
1、数学函数:
例如 round
, cei
SELECT round(4.5); -- 结果是 5 SELECT ceil(4.5); -- 结果是 5 SELECT floor(4.5); -- 结果是 4 SELECT abs(-4.5); -- 结果是 4.5l
, floor
, abs
, rand
, exp
, log
等
2、字符串函数:例如 lower
, upper
, concat
, substr
, length
, trim
等。
SELECT lower('HELLO'); -- 结果是 'hello' SELECT upper('hello'); -- 结果是 'HELLO' SELECT concat('Hello', ' World'); -- 结果是 'Hello World' SELECT substr('Hello World', 1, 5); -- 结果是 'Hello' SELECT length('Hello'); -- 结果是 5。
3、日期函数:例如 year
, month
, day
, hour
, minute
, current_date
等。
SELECT year(current_date); -- 返回当前年份 SELECT month(current_date); -- 返回当前月份 SELECT day(current_date); -- 返回当前日期 SELECT hour(current_timestamp); -- 返回当前小时。
4、条件函数:例如 if
, coalesce
, nvl
, case
等。
SELECT if(1 > 0, 'true', 'false'); -- 结果是 'true' SELECT coalesce(NULL, 'default'); -- 结果是 'default' SELECT nvl(NULL, 'default'); -- 结果是 'default' SELECT case when 1 > 0 then 'true' else 'false' end; -- 结果是 'true'
5、聚合函数:例如 count
, sum
, avg
, max
, min
等。
SELECT count(1); -- 计算表中的行数 SELECT sum(column_name); -- 计算列的总和 SELECT avg(column_name); -- 计算列的平均值 SELECT max(column_name); -- 找出列的最大值 SELECT min(column_name); -- 找出列的最小值。