with recursive ——《寻找没有被执行的任务对》LeetCode Plus 会员专享题【详细解析】Hive / MySQL

报告，今天也有好好学习

已于 2022-02-09 15:55:04 修改

阅读量3.1k

点赞数 4

分类专栏： SQL刷题大全（Hive / MySQL）数据库文章标签： leetcode mysql with recursive

于 2021-12-30 20:59:29 首次发布

本文链接：https://blog.csdn.net/qq_44186838/article/details/122242584

版权

数据库同时被 2 个专栏收录

19 篇文章 18 订阅

订阅专栏

SQL刷题大全（Hive / MySQL）

16 篇文章 27 订阅

订阅专栏

大家早上好，本人姓吴，如果觉得文章写得还行的话也可以叫我吴老师。欢迎大家跟我一起走进数据分析的世界，一起学习！

感兴趣的朋友可以关注我的数据分析专栏，里面有许多优质的文章跟大家分享哦。
另外也欢迎大家关注我的SQL刷题专栏，里面有我分享的高质量SQL题，以及详细的解析。

自从在 blink说自己要每天都写一道sql题之后，有个粉丝朋友提议让我把做的题分享到博客上，到现在，已经是第13篇了，这段时间几乎也都是坚持每天都更新博客（虽然很水，但博客在我看来更重要的还是记录，能给他人带来收获是很不错的附加值，仅此而已），没有更新的时候也基本上是因为工作回来太晚，所以目前为止我对自己还是非常满意的，希望能再接再厉。

本篇博文又是我的SQL题分享环节，为了记录一下自己的做题过程，以及防止后续力扣会员过期无法再次查看题目，所以我每天都会给大家选出一道质量较高的SQL题目发表到博客上，并且会加上自己的一些解题技巧或实用知识点，希望对大家也能有所帮助。

那么今天给大家分享的题是LeetCode的第1767题——寻找没有被执行的任务对。

下面是问题的详细描述。

问题描述

表：Tasks

+----------------+---------+
| Column Name    | Type    |
+----------------+---------+
| task_id        | int     |
| subtasks_count | int     |
+----------------+---------+
task_id 是这个表的主键。
task_id 表示的为主任务的id,每一个task_id被分为了多个子任务(subtasks)，subtasks_count表示为子任务的个数（n），它的值表示了子任务的索引从1到n。
本表保证2 <=subtasks_count<= 20。

表： Executed

+---------------+---------+
| Column Name   | Type    |
+---------------+---------+
| task_id       | int     |
| subtask_id    | int     |
+---------------+---------+
(task_id, subtask_id) 是这个表的主键。
每一行表示标记为task_id的主任务与标记为subtask_id的子任务被成功执行。
本表保证，对于每一个task_id，subtask_id <= subtasks_count。

请试写一个SQL查询语句报告没有被执行的（主任务，子任务）对，即没有被执行的（task_id, subtask_id）。

以 任何顺序 返回即可。

查询结果格式如下：

Tasks table:
+---------+----------------+
| task_id | subtasks_count |
+---------+----------------+
| 1       | 3              |
| 2       | 2              |
| 3       | 4              |
+---------+----------------+

Executed table:
+---------+------------+
| task_id | subtask_id |
+---------+------------+
| 1       | 2          |
| 3       | 1          |
| 3       | 2          |
| 3       | 3          |
| 3       | 4          |
+---------+------------+

Result table:
+---------+------------+
| task_id | subtask_id |
+---------+------------+
| 1       | 1          |
| 1       | 3          |
| 2       | 1          |
| 2       | 2          |
+---------+------------+
Task 1 被分成了 3 subtasks (1, 2, 3)。只有 subtask 2 被成功执行, 所以我们返回 (1, 1) 和 (1, 3) 这两个主任务子任务对。
Task 2 被分成了 2 subtasks (1, 2)。没有一个subtask被成功执行, 因此我们返回(2, 1)和(2, 2)。
Task 3 被分成了 4 subtasks (1, 2, 3, 4)。所有的subtask都被成功执行，因此对于Task 3,我们不返回任何值。

解题思路

这里就需要用到with recursive这一方法了。

with recursive 则是一个递归的查询子句，他会把查询出来的结果再次代入到查询子句中继续查询。
如：
WITH RECURSIVE d(n, fact) AS (
VALUES (0, 1)
UNION ALL
SELECT n+1, (n+1)*fact FROM d WHERE n < 7
)
SELECT * FROM d
结果为：
0 1
1 1
2 2
3 6
4 24
5 120
6 720
7 5040

ok，明白了with recursive后，那就没啥问题啦。

代码实现

-- 为了让临时表实现自增长，
-- 首先声明其需要存在的列名(task_id, subtask_id)
with recursive tmp(task_id, subtask_id) AS (
    -- 先引入一行数据作为自增长的基础
    SELECT task_id, subtasks_count FROM Tasks
        -- 再让新形成的行加入到现有的表中
        UNION
    SELECT task_id, (subtask_id-1) AS subtasks_count 
    FROM tmp --（引用自身）
    WHERE subtask_id >= 2 
)
SELECT * FROM TT
WHERE (task_id, subtask_id) NOT IN ( SELECT * FROM Executed )