Apache Hive 是一个建立在 Hadoop 之上的数据仓库工具,它提供了一种类 SQL 查询语言(HiveQL)来查询和管理大数据集。Hive 提供了丰富的内置函数,可以用来处理和分析数据。以下是一些常用的 Hive 函数:
1、数学函数:
例如 round, ceiSELECT round(4.5); -- 结果是 5 SELECT ceil(4.5); -- 结果是 5 SELECT floor(4.5); -- 结果是 4 SELECT abs(-4.5); -- 结果是 4.5l, floor, abs, rand, exp, log 等
2、字符串函数:例如 lower, upper, concat, substr, length, trim 等。
SELECT lower('HELLO'); -- 结果是 'hello' SELECT upper('hello'); -- 结果是 'HELLO' SELECT concat('Hello', ' World'); -- 结果是 'Hello World' SELECT substr('Hello World', 1, 5); -- 结果是 'Hello' SELECT length('Hello'); -- 结果是 5。
3、日期函数:例如 year, month, day, hour, minute, current_date 等。
SELECT year(current_date); -- 返回当前年份 SELECT month(current_date); -- 返回当前月份 SELECT day(current_date); -- 返回当前日期 SELECT hour(current_timestamp); -- 返回当前小时。
4、条件函数:例如 if, coalesce, nvl, case 等。
SELECT if(1 > 0, 'true', 'false'); -- 结果是 'true' SELECT coalesce(NULL, 'default'); -- 结果是 'default' SELECT nvl(NULL, 'default'); -- 结果是 'default' SELECT case when 1 > 0 then 'true' else 'false' end; -- 结果是 'true'
5、聚合函数:例如 count, sum, avg, max, min 等。
SELECT count(1); -- 计算表中的行数 SELECT sum(column_name); -- 计算列的总和 SELECT avg(column_name); -- 计算列的平均值 SELECT max(column_name); -- 找出列的最大值 SELECT min(column_name); -- 找出列的最小值。