PostgreSQL 高阶函数详解：全面深入的功能与实用示例

微笑听雨。

已于 2024-08-02 19:53:31 修改

阅读量1.2k

点赞数 25

分类专栏： db 文章标签： postgresql 数据库递归查询窗口函数地理空间函数

于 2024-08-02 19:51:25 首次发布

本文链接：https://blog.csdn.net/qq_38411796/article/details/140878955

版权

db 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

PostgreSQL 高阶函数详解

PostgreSQL 是一款功能强大的开源关系数据库管理系统，以其丰富的功能和高扩展性著称。在数据处理和分析方面，PostgreSQL 提供了一系列高阶函数，可以极大地简化和优化各种复杂操作。本文将详细介绍 PostgreSQL 的高阶函数，涵盖递归查询、数学函数、集合操作符、字符串函数、JSON 函数、时间函数、聚合函数以及地理空间函数。通过全面的示例和详尽的解释，帮助你深入理解和灵活运用这些高阶函数，提高数据处理的效率和效果。

1. 递归查询（Recursive Queries）

递归查询用于处理层次结构数据，如组织结构或目录树。

1.1 WITH RECURSIVE

示例: 计算组织结构的所有下属员工。

WITH RECURSIVE org_chart AS (
  SELECT
    employee_id,
    manager_id,
    employee_name
  FROM
    employees
  WHERE
    manager_id IS NULL
  UNION ALL
  SELECT
    e.employee_id,
    e.manager_id,
    e.employee_name
  FROM
    employees e
  INNER JOIN
    org_chart o
  ON
    e.manager_id = o.employee_id
)
SELECT
  *
FROM
  org_chart;

解释:

WITH RECURSIVE：定义递归查询。
UNION ALL：将递归结果与基本结果合并。
第一部分选择顶级员工（没有经理的员工），第二部分递归地选择所有下属员工。

1.2 LATERAL

示例: 使用 LATERAL 展开一个数组。
```
SELECT
  employee,
  unnest(departments) AS department
FROM
  employees
CROSS JOIN LATERAL
  unnest(departments);
```
解释:
- CROSS JOIN LATERAL：允许在查询的每一行中引用前面的列。
- unnest(departments)：将数组展开成多行。

2. 数学函数（Mathematical Functions）

数学函数用于执行各种数学计算。

2.1 ABS

示例: 计算工资的绝对值。

SELECT
  employee,
  salary,
  ABS(salary) AS abs_salary
FROM
  employees;

解释: ABS(salary) 计算工资的绝对值。

2.2 ROUND

示例: 将工资四舍五入到最近的整数。
```
SELECT
  employee,
  salary,
  ROUND(salary) AS rounded_salary
FROM
  employees;
```
解释: ROUND(salary) 将工资四舍五入到最近的整数。

2.3 CEIL 和 FLOOR

示例: 计算工资的天花板值和地板值。

SELECT
  employee,
  salary,
  CEIL(salary) AS ceil_salary,
  FLOOR(salary) AS floor_salary
FROM
  employees;

解释:

CEIL(salary)：向上取整工资。
FLOOR(salary)：向下取整工资。

2.4 POWER

示例: 计算工资的平方。

SELECT
  employee,
  salary,
  POWER(salary, 2) AS salary_squared
FROM
  employees;

解释: POWER(salary, 2) 计算工资的平方。

2.5 SQRT

示例: 计算工资的平方根。

SELECT
  employee,
  salary,
  SQRT(salary) AS salary_sqrt
FROM
  employees;

解释: SQRT(salary) 计算工资的平方根。

2.6 RANDOM

示例: 生成一个随机数。
```
SELECT
  employee,
  salary,
  RANDOM() AS random_value
FROM
  employees;
```
解释: RANDOM() 生成一个 0 到 1 之间的随机浮点数。

2.7 TRUNC

示例: 截断工资到小数点后的指定位置。
```
SELECT
  employee,
  salary,
  TRUNC(salary, 2) AS truncated_salary
FROM
  employees;
```
解释: TRUNC(salary, 2) 将工资截断到小数点后 2 位。

3. 集合操作符（Set Operators）

集合操作符用于处理和组合结果集。

3.1 UNION

示例: 合并两个不同部门的员工列表。

SELECT
  employee_name
FROM
  employees
WHERE
  department = 'Sales'
UNION
SELECT
  employee_name
FROM
  employees
WHERE
  department = 'Marketing';

解释: UNION 合并两个结果集，并自动去重。

3.2 UNION ALL

示例: 合并两个部门的员工列表，包括重复的员工。

SELECT
  employee_name
FROM
  employees
WHERE
  department = 'Sales'
UNION ALL
SELECT
  employee_name
FROM
  employees
WHERE
  department = 'Marketing';

解释: UNION ALL 合并两个结果集，包括重复的行。

3.3 INTERSECT

示例: 查找两个部门共有的员工。

SELECT
  employee_name
FROM
  employees
WHERE
  department = 'Sales'
INTERSECT
SELECT
  employee_name
FROM
  employees
WHERE
  department = 'Marketing';

解释: INTERSECT 返回两个结果集的交集。

3.4 EXCEPT

示例: 查找只在销售部门工作的员工，不在市场部门工作的员工。
```
SELECT
  employee_name
FROM
  employees
WHERE
  department = 'Sales'
EXCEPT
SELECT
  employee_name
FROM
  employees
WHERE
  department = 'Marketing';
```
解释: EXCEPT 返回第一个结果集中的行，但不在第二个结果集中出现的行。

4. 窗口函数（Window Functions）

窗口函数用于对结果集的一个窗口进行计算，而不会改变结果集的行数。

4.1 ROW_NUMBER

示例: 给每个员工分配一个唯一的序号。
```
SELECT
  employee_name,
  salary,
  ROW_NUMBER() OVER (ORDER BY salary DESC) AS row_num
FROM
  employees;
```
解释: ROW_NUMBER() OVER (ORDER BY salary DESC) 为员工按工资降序排序并分配一个唯一的序号。

4.2 RANK

示例: 给每个员工分配一个排名，处理重复值时赋相同排名。
```
SELECT
  employee_name,
  salary,
  RANK() OVER (ORDER BY salary DESC) AS rank
FROM
  employees;
```
解释: RANK() OVER (ORDER BY salary DESC) 为员工按工资降序排序并分配排名，处理重复值时赋相同排名。

4.3 DENSE_RANK

示例: 与 RANK 类似，但没有排名的空缺。
```
SELECT
  employee_name,
  salary,
  DENSE_RANK() OVER (ORDER BY salary DESC) AS dense_rank
FROM
  employees;
```
解释: DENSE_RANK() OVER (ORDER BY salary DESC) 为员工按工资降序排序并分配排名，处理重复值时不跳过排名。

4.4 NTILE

示例: 将员工分为四组，并为每个组分配一个组号。
```
SELECT
  employee_name,
  salary,
  NTILE(4) OVER (ORDER BY salary DESC) AS quartile
FROM
  employees;
```
解释: NTILE(4) OVER (ORDER BY salary DESC) 将员工按工资降序排序并分为四组。

4.5 LEAD 和 LAG

示例: 比较当前工资与下一个员工工资的差异。

SELECT
  employee_name,
  salary,
  LEAD(salary, 1) OVER (ORDER BY salary) AS next_salary,
  LAG(salary, 1) OVER (ORDER BY salary) AS prev_salary
FROM
  employees;

解释:

LEAD(salary, 1)：返回当前行之后指定偏移量的值。
LAG(salary, 1)：返回当前行之前指定偏移量的值。

5. 字符串函数（String Functions）

字符串函数用于处理和操作文本数据。

5.1 CONCAT

示例: 将名字和姓氏连接在一起。
```
SELECT
  CONCAT(first_name, ' ', last_name) AS full_name
FROM
  employees;
```
解释: CONCAT(first_name, ' ', last_name) 将名字和姓氏连接在一起。

5.2 TRIM

示例: 去掉名字中的多余空格。
```
SELECT
  TRIM(employee_name) AS trimmed_name
FROM
  employees;
```
解释: TRIM(employee_name) 去掉名字中的前后空格。

5.3 SUBSTRING

示例: 提取员工名字的前两个字符。
```
SELECT
  employee_name,
  SUBSTRING(employee_name FROM 1 FOR 2) AS name_prefix
FROM
  employees;
```
解释: SUBSTRING(employee_name FROM 1 FOR 2) 提取员工名字的前两个字符。

5.4 REPLACE

示例: 替换名字中的中间名。

SELECT
  employee_name,
  REPLACE(employee_name, 'MiddleName', 'NewMiddleName') AS updated_name
FROM
  employees;

解释: REPLACE(employee_name, 'MiddleName', 'NewMiddleName') 替换名字中的中间名。

6. JSON 函数（JSON Functions）

JSON 函数用于处理 JSON 数据类型。

6.1 JSON_AGG

示例: 聚合员工数据为 JSON 数组。
```
SELECT
  JSON_AGG(employee) AS employees_json
FROM
  employees;
```
解释: JSON_AGG(employee) 聚合员工数据为 JSON 数组。

6.2 JSON_BUILD_OBJECT

示例: 将员工信息构建为 JSON 对象。

SELECT
  JSON_BUILD_OBJECT(
    'employee_name', employee_name,
    'salary', salary
  ) AS employee_json
FROM
  employees;

解释: JSON_BUILD_OBJECT 将员工信息构建为 JSON 对象。

6.3 JSONB_SET

示例: 更新 JSONB 列中的字段。
```
UPDATE
  employees
SET
  details = JSONB_SET(details, '{salary}', '60000')
WHERE
  employee_id = 1;
```
解释: JSONB_SET(details, '{salary}', '60000') 更新 JSONB 列中的工资字段。

7. 时间函数（Date and Time Functions）

时间函数用于处理日期和时间数据。

7.1 AGE

示例: 计算员工从某日期起的年龄。
```
SELECT
  employee_name,
  AGE(hire_date) AS age
FROM
  employees;
```
解释: AGE(hire_date) 计算员工从雇佣日期起的年龄。

7.2 DATE_TRUNC

示例: 将日期截断到月份级别。
```
SELECT
  DATE_TRUNC('month', hire_date) AS start_of_month
FROM
  employees;
```
解释: DATE_TRUNC('month', hire_date) 将日期截断到月份的开始。

7.3 NOW 和 CURRENT_TIMESTAMP

示例: 获取当前日期和时间。
```
SELECT
  NOW() AS current_time,
  CURRENT_TIMESTAMP AS current_timestamp;
```
解释:
- NOW()：获取当前日期和时间。
- CURRENT_TIMESTAMP：获取当前日期和时间。

8. 聚合函数（Aggregate Functions）

聚合函数用于对数据集进行汇总。

8.1 SUM

示例: 计算员工的总工资。
```
SELECT
  SUM(salary) AS total_salary
FROM
  employees;
```
解释: SUM(salary) 计算员工的总工资。

8.2 AVG

示例: 计算员工的平均工资。
```
SELECT
  AVG(salary) AS average_salary
FROM
  employees;
```
解释: AVG(salary) 计算员工的平均工资。

8.3 COUNT

示例: 计算员工的总数。
```
SELECT
  COUNT(*) AS employee_count
FROM
  employees;
```
解释: COUNT(*) 计算员工的总数。

8.4 GROUP_CONCAT

示例: 计算每个部门的员工名字列表。

SELECT
  department,
  STRING_AGG(employee_name, ', ') AS employee_names
FROM
  employees
GROUP BY
  department;

解释: STRING_AGG(employee_name, ', ') 连接每个部门的员工名字。

9. 地理空间函数（Geospatial Functions）

地理空间函数用于处理地理数据。

9.1 ST_Distance

示例: 计算两个地理点之间的距离。

SELECT
  ST_Distance(
    ST_MakePoint(longitude1, latitude1),
    ST_MakePoint(longitude2, latitude2)
  ) AS distance
FROM
  locations;

解释: ST_Distance 计算两个地理点之间的距离。

9.2 ST_Within

示例: 查找位于某区域内的点。

SELECT
  location_name
FROM
  locations
WHERE
  ST_Within(
    ST_MakePoint(longitude, latitude),
    ST_MakePolygon(geometry)
  );

解释: ST_Within 检查点是否在多边形区域内。

总结

本文详细介绍了 PostgreSQL 的各种高阶函数，涵盖了递归查询、数学函数、集合操作符、字符串函数、JSON 函数、时间函数、聚合函数以及地理空间函数。每个类别下的函数都配有详细的示例代码和解释，以帮助你更好地理解和应用这些功能。通过掌握这些高阶函数，你可以更高效地处理和分析数据，满足复杂的数据处理需求。无论是处理层次结构数据、进行数学计算、操作字符串、管理 JSON 数据、处理时间和日期、进行数据汇总，还是处理地理空间数据，PostgreSQL 的高阶函数都能为你提供强大的支持。希望本文能成为你深入了解和使用 PostgreSQL 的重要参考资料。