HiveSQL(Hive SQL)是Apache Hive所使用的SQL方言,专门用于在Hadoop上进行大规模数据处理。以下是一些常见的HiveSQL函数及其使用方法:
1. 聚合函数
COUNT
统计记录数。
SELECT COUNT(*) FROM employees;
SUM
计算数值列的总和。
SELECT SUM(salary) FROM employees;
AVG
计算数值列的平均值。
SELECT AVG(salary) FROM employees;
MAX
返回数值列的最大值。
SELECT MAX(salary) FROM employees;
MIN
返回数值列的最小值。
SELECT MIN(salary) FROM employees;
2. 字符串函数
CONCAT
连接两个或多个字符串。
SELECT CONCAT(first_name, ' ', last_name) AS full_name FROM employees;
SUBSTR
截取字符串的子串。
SELECT SUBSTR(first_name, 1, 3) AS short_name FROM employees;
LENGTH
返回字符串的长度。
SELECT LENGTH(first_name) AS name_length FROM employees;
UPPER
将字符串转换为大写。
SELECT UPPER(<