LeetCode题练习与总结：第二高的薪水--176-CSDN博客

本文链接：https://blog.csdn.net/weixin_62860386/article/details/140595207

一、题目描述

SQL Schema > Pandas Schema >

Employee 表：

+-------------+------+
| Column Name | Type |
+-------------+------+
| id          | int  |
| salary      | int  |
+-------------+------+
在 SQL 中，id 是这个表的主键。
表的每一行包含员工的工资信息。

查询并返回 Employee 表中第二高的薪水。如果不存在第二高的薪水，查询应该返回 null(Pandas 则返回 None) 。

查询结果如下例所示。

示例 1：

输入：
Employee 表：
+----+--------+
| id | salary |
+----+--------+
| 1  | 100    |
| 2  | 200    |
| 3  | 300    |
+----+--------+
输出：
+---------------------+
| SecondHighestSalary |
+---------------------+
| 200                 |
+---------------------+

示例 2：

输入：
Employee 表：
+----+--------+
| id | salary |
+----+--------+
| 1  | 100    |
+----+--------+
输出：
+---------------------+
| SecondHighestSalary |
+---------------------+
| null                |
+---------------------+

二、解题思路

首先，我们需要从 Employee 表中选出所有的薪水。
然后，对这些薪水进行去重，以便能够正确地识别第二高的薪水。
对去重后的薪水进行排序，并选择第二个记录作为第二高的薪水。
如果表中只有一种薪水或者没有薪水记录，那么我们应该返回 null。

三、具体代码

SELECT
    IFNULL(
        (SELECT DISTINCT salary
         FROM Employee
         ORDER BY salary DESC
         LIMIT 1 OFFSET 1),
        NULL
    ) AS SecondHighestSalary;

四、时间复杂度和空间复杂度

1. 时间复杂度

DISTINCT salary:O(n)，其中 n 是表中的行数。这是因为需要对所有的 salary 进行去重操作。
ORDER BY salary DESC:O(n log n)，排序操作通常具有这个时间复杂度。
LIMIT 1 OFFSET 1:O(1)，在已经排序的列表中选择特定位置的元素是常数时间操作。

综合上述步骤，整个查询的时间复杂度由排序步骤主导，因此时间复杂度为 O(n log n)。

2. 空间复杂度

DISTINCT salary:O(n)，在最坏的情况下，如果所有的 salary 都是唯一的，那么去重操作需要存储所有不同的 salary 值。
ORDER BY salary DESC:O(n)，排序操作可能需要额外的空间来存储排序后的结果，尤其是在不能在原地进行排序的情况下。
LIMIT 1 OFFSET 1:O(1)，这个操作只需要存储一个值，即第二高的 salary。

综合上述步骤，整个查询的空间复杂度为 O(n)，这是因为我们需要存储去重和排序后的所有 salary 值。

请注意，实际的性能表现还取决于许多其他因素，包括数据库的具体实现、硬件性能、索引的存在和类型等。以上分析是基于一般的数据库操作复杂度进行的大致估计。

五、总结知识点

子查询 (Subquery):子查询是嵌套在主查询中的查询。在本例中，子查询用于找出第二高的薪水。
DISTINCT 关键字:DISTINCT 用于返回唯一不同的值。在这里，它用于确保 salary 列的值是唯一的，从而能够正确地识别第二高的薪水。
ORDER BY 子句:ORDER BY 用于对结果集进行排序。在这里，它按照 salary 列的值降序排列，以确保最高的薪水排在最前面。
LIMIT 和 OFFSET 子句:LIMIT 用于限制查询返回的记录数。OFFSET 用于指定从哪条记录开始返回。这两个子句结合使用可以精确地选择特定的记录，例如本例中的第二高薪水。
IFNULL 函数:IFNULL 是一个 SQL 函数，它检查第一个参数是否为 NULL。如果是，则返回第二个参数；如果不是，则返回第一个参数。在本例中，它用于处理不存在第二高薪水的情况，返回 NULL。
别名 (AS):AS 用于给查询结果中的列或表指定一个别名。在本例中，它用于将子查询的结果列命名为 SecondHighestSalary。
聚合函数和选择列表:子查询中使用了聚合函数 DISTINCT 来去重，并且将聚合后的结果作为选择列表的一部分。