【SQL】SQL常见面试题总结（4）

最新推荐文章于 2024-09-23 09:43:13 发布

Hanson Huang

最新推荐文章于 2024-09-23 09:43:13 发布

阅读量1.2k

点赞数 17

本文链接：https://blog.csdn.net/weixin_45683778/article/details/138952563

版权

数据库同时被 2 个专栏收录

12 篇文章 1 订阅

订阅专栏

面试题

10 篇文章 0 订阅

订阅专栏

1、空值处理
- 1.1、统计有未完成状态的试卷的未完成数和未完成率
- 1.2、0 级用户高难度试卷的平均用时和平均得分
2、高级条件语句
3、限量查询
- 3.1、注册时间最早的三个人
- 3.2、注册当天就完成了试卷的名单第三页（较难）
4、文本转换函数
- 4.1、修复串列了的记录
- 4.2、对过长的昵称截取处理

1、空值处理

1.1、统计有未完成状态的试卷的未完成数和未完成率

描述：

现有试卷作答记录表 exam_record（uid 用户 ID, exam_id 试卷 ID, start_time 开始作答时间, submit_time 交卷时间,score得分），数据如下：

id	uid	exam_id	start_time	submit_time	score
1	1001	9001	2020-01-02 09:01:01	2020-01-02 09:21:01	80
2	1001	9001	2021-05-02 10:01:01	2021-05-02 10:30:01	81
3	1001	9001	2021-09-02 12:01:01	(NULL)	(NULL)

请统计有未完成状态的试卷的未完成数 incomplete_cnt 和未完成率 incomplete_rate。由示例数据结果输出如下：

exam_id	incomplete_cnt	complete_rate
9001	1	0.333

解释：试卷 9001 有 3 次被作答的记录，其中两次完成，1 次未完成，因此未完成数为 1，未完成率为 0.333（保留 3 位小数）

思路：

这题只需要注意一个是有条件限制，一个是没条件限制的；要么分别查询条件，然后合并；要么直接在 select 里面进行条件判断。

答案：

SELECT exam_id,
			 COUNT(submit_time IS NULL OR NULL) incomplete_cnt,
			 ROUND(COUNT(submit_time IS NULL OR NULL)/COUNT(*),3) complete_rate
FROM exam_record
GROUP BY exam_id
HAVING incomplete_cnt <> 0

在这里插入图片描述

注意：

COUNT(submit_time IS NULL OR NULL):

submit_time IS NULL OR NULL 是一个逻辑表达式。submit_time IS NULL 会返回一个布尔值 TRUE 或 FALSE，然后 OR NULL 操作将结果转换为 TRUE 或 NULL。由于 NULL 在 OR 操作中不会影响 TRUE 的结果，所以结果等效于 submit_time IS NULL。
这样，表达式的结果是 TRUE 或 NULL。
然而，COUNT 函数只会计算非 NULL 的值，因此它只会计算 TRUE 的次数。实际上，这意味着它会统计 submit_time 为 NULL 的次数。

COUNT(submit_time IS NULL):

submit_time IS NULL 是一个布尔表达式，会返回 TRUE 或 FALSE。
这里 COUNT 函数计算的是真值 TRUE 和 FALSE 的数量，而不是 NULL的数量。
由于 COUNT 只计算非 NULL 的值，这意味着 submit_time IS NULL 返回的所有 TRUE 或 FALSE 值都被计数为 1。因此，它统计的是记录的总数，因为 TRUE 和 FALSE 都不是 NULL。

总结

第一个查询 COUNT(submit_time IS NULL OR NULL) 实际上统计的是 submit_time 列为空的记录数，因为 TRUE 和 NULL 中只有 TRUE 被计数。
第二个查询 COUNT(submit_time IS NULL) 统计的是所有记录的总数，因为布尔表达式 TRUE 或 FALSE 都被认为是非 NULL，因此都被计数。

1.2、0 级用户高难度试卷的平均用时和平均得分

描述：

现有用户信息表 user_info（uid 用户 ID，nick_name 昵称, achievement 成就值, level 等级, job 职业方向, register_time 注册时间），数据如下：

id	uid	nick_name	achievement	level	job	register_time
1	1001	机器人 1 号	10	0	算法	2020-01-01 10:00:00
2	1002	机器人 2 号	2100	6	算法	2020-01-01 10:00:00

试卷信息表 examination_info（exam_id：试卷 ID, tag：试卷类别, difficulty：试卷难度, duration：考试时长, release_time：发布时间），示例数据如下：

id	exam_id	tag	difficulty	duration	release_time
1	9001	SQL	hard	60	2020-01-01 10:00:00
2	9002	SQL	easy	60	2020-01-01 10:00:00
3	9004	算法	medium	80	2020-01-01 10:00:00

试卷作答记录表 exam_record（uid 用户 ID,exam_id 试卷 ID, start_time 开始作答时间, submit_time 交卷时间, score 得分）示例数据如下：

id	uid	exam_id	start_time	submit_time	score
1	1001	9001	2020-01-02 09:01:01	2020-01-02 09:21:59	80
2	1001	9001	2021-05-02 10:01:01	(NULL)	(NULL)
3	1001	9002	2021-02-02 19:01:01	2021-02-02 19:30:01	87
4	1001	9001	2021-06-02 19:01:01	2021-06-02 19:32:00	20
5	1001	9002	2021-09-05 19:01:01	2021-09-05 19:40:01	89
6	1001	9002	2021-09-01 12:01:01	(NULL)	(NULL)
7	1002	9002	2021-05-05 18:01:01	2021-05-05 18:59:02	90

请输出每个 0 级用户所有的高难度试卷考试平均用时和平均得分，未完成的默认试卷最大考试时长和 0 分处理。由示例数据结果输出如下：

uid	avg_score	avg_time_took
1001	33	36.7

解释：0 级用户有 1001，高难度试卷有 9001，1001 作答 9001 的记录有 3 条，分别用时 20 分钟、未完成（试卷时长 60 分钟）、30 分钟（未满 31 分钟），分别得分为 80 分、未完成（0 分处理）、20 分。因此他的平均用时为 110/3=36.7（保留一位小数），平均得分为 33 分（取整）

思路：这题用IF是判断的最方便的，因为涉及到 NULL 值的判断。当然 case when也可以，大同小异。这题的难点就在于空值的处理，其他的这些查询条件什么的，我相信难不倒大家。

SELECT uid,
			 ROUND(AVG(new_score)) AS avg_score,
			 ROUND(AVG(time_diff),1) AS avg_time_took
			
FROM (
	SELECT er.uid,
				 IF(er.submit_time IS NOT NULL,TIMESTAMPDIFF(MINUTE,start_time,submit_time),ei.duration) AS time_diff,
				 IF(er.submit_time IS NOT NULL,er.score,0) AS new_score
	FROM exam_record  er
	LEFT JOIN user_info ui ON er.uid = ui.uid
	LEFT JOIN examination_info ei ON er.exam_id = ei.exam_id
	WHERE ui.`level` = 0 AND ei.difficulty = 'hard'
) t
GROUP BY uid

在这里插入图片描述

2、高级条件语句

2.1、筛选限定昵称成就值活跃日期的用户（较难）

描述：

现有用户信息表 user_info（uid 用户 ID，nick_name 昵称, achievement 成就值, level 等级, job 职业方向, register_time 注册时间），数据如下：

id	uid	nick_name	achievement	level	job	register_time
1	1001	机器人 1 号	1000	2	算法	2020-01-01 10:00:00
2	1002	机器人 2 号	1200	3	算法	2020-01-01 10:00:00
3	1003	高达 3 号	2200	5	算法	2020-01-01 10:00:00
4	1004	机器人 4 号	2500	6	算法	2020-01-01 10:00:00
5	1005	机器人 5 号	3000	7	C++	2020-01-01 10:00:00

现有试卷作答记录表 exam_record（uid 用户 ID,exam_id 试卷 ID, start_time 开始作答时间, submit_time 交卷时间, score 得分）示例数据如下：

id	uid	exam_id	start_time	submit_time	score
1	1001	9001	2020-01-02 09:01:01	2020-01-02 09:21:59	80
3	1001	9002	2021-02-02 19:01:01	2021-02-02 19:30:01	87
2	1001	9001	2021-05-02 10:01:01	(NULL)	(NULL)
4	1001	9001	2021-06-02 19:01:01	2021-06-02 19:32:00	20
6	1001	9002	2021-09-01 12:01:01	(NULL)	(NULL)
5	1001	9002	2021-09-05 19:01:01	2021-09-05 19:40:01	89
11	1002	9001	2020-01-01 12:01:01	2020-01-01 12:31:01	81
12	1002	9002	2020-02-01 12:01:01	2020-02-01 12:31:01	82
13	1002	9002	2020-02-02 12:11:01	2020-02-02 12:31:01	83
7	1002	9002	2021-05-05 18:01:01	2021-05-05 18:59:02	90
16	1002	9001	2021-09-06 12:01:01	2021-09-06 12:21:01	80
17	1002	9001	2021-09-06 12:01:01	(NULL)	(NULL)
18	1002	9001	2021-09-07 12:01:01	(NULL)	(NULL)
8	1003	9003	2021-02-06 12:01:01	(NULL)	(NULL)
9	1003	9001	2021-09-07 10:01:01	2021-09-07 10:31:01	89
10	1004	9002	2021-08-06 12:01:01	(NULL)	(NULL)
14	1005	9001	2021-02-01 11:01:01	2021-02-01 11:31:01	84
15	1006	9001	2021-02-01 11:01:01	2021-02-01 11:31:01	84

题目练习表 practice_record（uid 用户 ID, question_id 题目 ID, submit_time 提交时间, score 得分）：

id	uid	question_id	submit_time	score
1	1001	8001	2021-08-02 11:41:01	60
2	1002	8001	2021-09-02 19:30:01	50
3	1002	8001	2021-09-02 19:20:01	70
4	1002	8002	2021-09-02 19:38:01	70
5	1003	8002	2021-09-01 19:38:01	80

请找到昵称以『机器人』开头『号』结尾、成就值在 1200~2500 之间，且最近一次活跃（答题或作答试卷）在 2021 年 9 月的用户信息。

由示例数据结果输出如下：

uid	nick_name	achievement
1002	机器人 2 号	1200

解释：昵称以『机器人』开头『号』结尾且成就值在 1200~2500 之间的有 1002、1004；

1002 最近一次试卷区活跃为 2021 年 9 月，最近一次题目区活跃为 2021 年 9 月；1004 最近一次试卷区活跃为 2021 年 8 月，题目区未活跃。

因此最终满足条件的只有 1002。

思路：

先根据条件列出主要查询语句

昵称以『机器人』开头『号』结尾: nick_name LIKE "机器人%号"

成就值在 1200~2500 之间：achievement BETWEEN 1200 AND 2500

第三个条件因为限定了为 9 月，所以直接写就行：( date_format( record.submit_time, '%Y%m' )= 202109 OR date_format( pr.submit_time, '%Y%m' )= 202109 )

答案:

SELECT DISTINCT u_info.uid,
                u_info.nick_name,
                u_info.achievement
FROM user_info u_info
LEFT JOIN exam_record record ON record.uid = u_info.uid
LEFT JOIN practice_record pr ON u_info.uid = pr.uid
WHERE u_info.nick_name LIKE "机器人%号"
  AND u_info.achievement BETWEEN 1200
  AND 2500
  AND (date_format(record.submit_time, '%Y%m')= 202109
       OR date_format(pr.submit_time, '%Y%m')= 202109)
GROUP BY u_info.uid

2.2、筛选昵称规则和试卷规则的作答记录（较难）

描述：

现有用户信息表 user_info（uid 用户 ID，nick_name 昵称, achievement 成就值, level 等级, job 职业方向, register_time 注册时间），数据如下：

id	uid	nick_name	achievement	level	job	register_time
1	1001	机器人1号	1900	2	算法	2020-01-01 10:00:00
2	1002	机器人2号	1200	3	算法	2020-01-01 10:00:00
3	1003	机器人3 号 ♂	2200	5	算法	2020-01-01 10:00:00
4	1004	机器人 4号	2500	6	算法	2020-01-01 10:00:00
5	1005	机器人555号	2000	7	C++	2020-01-01 10:00:00
6	1006	666666	3000	6	C++	2020-01-01 10:00:00

试卷信息表 examination_info（exam_id：试卷 ID, tag：试卷类别, difficulty：试卷难度, duration：考试时长, release_time：发布时间），示例数据如下：

id	exam_id	tag	difficulty	duration	release_time
1	9001	C++	hard	60	2020-01-01 10:00:00
2	9002	c#	hard	80	2020-01-01 10:00:00
3	9003	SQL	medium	70	2020-01-01 10:00:00

现有试卷作答记录表 exam_record（uid 用户 ID,exam_id 试卷 ID, start_time 开始作答时间, submit_time 交卷时间, score 得分）示例数据如下：

id	uid	exam_id	start_time	submit_time	score
1	1001	9001	2020-01-02 09:01:01	2020-01-02 09:21:59	80
2	1001	9001	2021-05-02 10:01:01	(NULL)	(NULL)
4	1001	9001	2021-06-02 19:01:01	2021-06-02 19:32:00	20
3	1001	9002	2021-02-02 19:01:01	2021-02-02 19:30:01	87
5	1001	9002	2021-09-05 19:01:01	2021-09-05 19:40:01	89
6	1001	9002	2021-09-01 12:01:01	(NULL)	(NULL)
11	1002	9001	2020-01-01 12:01:01	2020-01-01 12:31:01	81
16	1002	9001	2021-09-06 12:01:01	2021-09-06 12:21:01	80
17	1002	9001	2021-09-06 12:01:01	(NULL)	(NULL)
18	1002	9001	2021-09-07 12:01:01	(NULL)	(NULL)
7	1002	9002	2021-05-05 18:01:01	2021-05-05 18:59:02	90
12	1002	9002	2020-02-01 12:01:01	2020-02-01 12:31:01	82
13	1002	9002	2020-02-02 12:11:01	2020-02-02 12:31:01	83
9	1003	9001	2021-09-07 10:01:01	2021-09-07 10:31:01	89
8	1003	9003	2021-02-06 12:01:01	(NULL)	(NULL)
10	1004	9002	2021-08-06 12:01:01	(NULL)	(NULL)
14	1005	9001	2021-02-01 11:01:01	2021-02-01 11:31:01	84
15	1006	9001	2021-02-01 11:01:01	2021-09-01 11:31:01	84

找到昵称以"机器人"+纯数字+"号"或者纯数字组成的用户对于字母 c 开头的试卷类别（如 C,C++,c#等）的已完成的试卷 ID 和平均得分，按用户 ID、平均分升序排序。由示例数据结果输出如下：

uid	exam_id	avg_score
1006	9001	84

解释：昵称满足条件的用户有 1001、1002、1004、1005、1006；

c 开头的试卷有 9001、9002；

满足上述条件的作答记录中，1002 完成 9001 的得分有 81、80，平均分为 81（80.5 取整四舍五入得 81）；

1002 完成 9002 的得分有 90、82、83，平均分为 85；

思路：

还是老样子，既然给出了条件，就先把各个条件先写出来

找到昵称以"机器人"+纯数字+"号"或者纯数字组成的用户：我最开始是这么写的：nick_name LIKE '机器人%号' OR nick_name REGEXP'^[0-9]+$'，如果表中有个 “机器人 H 号” ，那也能通过。

所以这里还得用正则： nick_name LIKE '^机器人[0-9]+号'

对于字母 c 开头的试卷类别： e_info.tag LIKE 'c%' 或者 tag regexp '^c|^C' 第一个也能匹配到大写 C

答案：

SELECT UID,
       exam_id,
       ROUND(AVG(score), 0) avg_score
FROM exam_record
WHERE UID IN
    (SELECT UID
     FROM user_info
     WHERE nick_name RLIKE "^机器人[0-9]+号 $"
       OR nick_name RLIKE "^[0-9]+$")
  AND exam_id IN
    (SELECT exam_id
     FROM examination_info
     WHERE tag RLIKE "^[cC]")
  AND score IS NOT NULL
GROUP BY UID,exam_id
ORDER BY UID,avg_score;

2.3、各用户等级的不同得分表现占比（较难）

描述：

现有用户信息表 user_info（uid 用户 ID，nick_name 昵称, achievement 成就值, level 等级, job 职业方向, register_time 注册时间），数据如下：

id	uid	nick_name	achievement	level	job	register_time
1	1001	机器人1号	19	0	算法	2020-01-01 10:00:00
2	1002	机器人2号	1200	3	算法	2020-01-01 10:00:00
3	1003	机器人3 号 ♂	22	0	算法	2020-01-01 10:00:00
4	1004	机器人 4号	25	0	算法	2020-01-01 10:00:00
5	1005	机器人555号	2000	7	C++	2020-01-01 10:00:00
6	1006	666666	3000	6	C++	2020-01-01 10:00:00

现有试卷作答记录表 exam_record（uid 用户 ID,exam_id 试卷 ID, start_time 开始作答时间, submit_time 交卷时间, score 得分）示例数据如下：

id	uid	exam_id	start_time	submit_time	score
1	1001	9001	2020-01-02 09:01:01	2020-01-02 09:21:59	80
2	1001	9001	2021-05-02 10:01:01	(NULL)	(NULL)
3	1001	9002	2021-02-02 19:01:01	2021-02-02 19:30:01	75
4	1001	9002	2021-09-01 12:01:01	2021-09-01 12:11:01	60
5	1001	9003	2021-09-02 12:01:01	2021-09-02 12:41:01	90
6	1001	9001	2021-06-02 19:01:01	2021-06-02 19:32:00	20
7	1001	9002	2021-09-05 19:01:01	2021-09-05 19:40:01	89
8	1001	9004	2021-09-03 12:01:01	(NULL)	(NULL)
9	1002	9001	2020-01-01 12:01:01	2020-01-01 12:31:01	99
10	1002	9003	2020-02-01 12:01:01	2020-02-01 12:31:01	82
11	1002	9003	2020-02-02 12:11:01	2020-02-02 12:41:01	76

为了得到用户试卷作答的定性表现，我们将试卷得分按分界点[90,75,60]分为优良中差四个得分等级（分界点划分到左区间），请统计不同用户等级的人在完成过的试卷中各得分等级占比（结果保留 3 位小数），未完成过试卷的用户无需输出，结果按用户等级降序、占比降序排序。

由示例数据结果输出如下：

level	score_grade	ratio
3	良	0.667
3	优	0.333
0	良	0.500
0	中	0.167
0	优	0.167
0	差	0.167

解释：完成过试卷的用户有 1001、1002；完成了的试卷对应的用户等级和分数等级如下：

uid	exam_id	score	level score_grade
1001	9001	80	0
1001	9002	75	0
1001	9002	60	0
1001	9003	90	0
1001	9001	20	0
1001	9002	89	0
1002	9001	99	3
1002	9003	82	3
1002	9003	76	3

因此 0 级用户（只有 1001）的各分数等级比例为：优 1/6，良 1/6，中 1/6，差 3/6；3 级用户（只有 1002）各分数等级比例为：优 1/3，良 2/3。结果保留 3 位小数。

思路：

先把 将试卷得分按分界点[90,75,60]分为优良中差四个得分等级这个条件写出来，这里可以用到case when

CASE
		WHEN a.score >= 90 THEN
		'优'
		WHEN a.score < 90 AND a.score >= 75 THEN
		'良'
		WHEN a.score < 75 AND a.score >= 60 THEN
	'中' ELSE '差'
END

这题的关键点就在于这，其他剩下的就是条件拼接了

答案：

SELECT a.LEVEL,
       a.score_grade,
       ROUND(a.cur_count / b.total_num, 3) AS ratio
FROM
  (SELECT b.LEVEL AS LEVEL,
          (CASE
               WHEN a.score >= 90 THEN '优'
               WHEN a.score < 90
                    AND a.score >= 75 THEN '良'
               WHEN a.score < 75
                    AND a.score >= 60 THEN '中'
               ELSE '差'
           END) AS score_grade,
          count(1) AS cur_count
   FROM exam_record a
   LEFT JOIN user_info b ON a.uid = b.uid
   WHERE a.submit_time IS NOT NULL
   GROUP BY b.LEVEL,
            score_grade) a
LEFT JOIN
  (SELECT b.LEVEL AS LEVEL,
          count(b.LEVEL) AS total_num
   FROM exam_record a
   LEFT JOIN user_info b ON a.uid = b.uid
   WHERE a.submit_time IS NOT NULL
   GROUP BY b.LEVEL) b ON a.LEVEL = b.LEVEL
ORDER BY a.LEVEL DESC,
         ratio DESC

3、限量查询

3.1、注册时间最早的三个人

描述：

现有用户信息表 user_info（uid 用户 ID，nick_name 昵称, achievement 成就值, level 等级, job 职业方向, register_time 注册时间），数据如下：

id	uid	nick_name	achievement	level	job	register_time
1	1001	机器人1号	19	0	算法	2020-01-01 10:00:00
2	1002	机器人2号	1200	3	算法	2020-02-01 10:00:00
3	1003	机器人3 号 ♂	22	0	算法	2020-01-02 10:00:00
4	1004	机器人 4号	25	0	算法	2020-01-02 11:00:00
5	1005	机器人555号	2000	7	C++	2020-01-11 10:00:00
6	1006	666666	3000	6	C++	2020-11-01 10:00:00

请从中找到注册时间最早的 3 个人。由示例数据结果输出如下：

uid	nick_name	register_time
1001	机器人1号	2020-01-01 10:00:00
1003	机器人 3 号 ♂	2020-01-02 10:00:00
1004	机器人 4 号	2020-01-02 11:00:00

解释：按注册时间排序后选取前三名，输出其用户 ID、昵称、注册时间。

答案：

SELECT uid,nick_name,register_time
FROM user_info
ORDER BY register_time 
LIMIT 3

在这里插入图片描述

3.2、注册当天就完成了试卷的名单第三页（较难）

现有用户信息表 user_info（uid 用户 ID，nick_name 昵称, achievement 成就值, level 等级, job 职业方向, register_time 注册时间），数据如下：

id	uid	nick_name	achievement	level	job	register_time
1	1001	机器人 1	19	0	算法	2020-01-01 10:00:00
2	1002	机器人 2 号	1200	3	算法	2020-01-01 10:00:00
3	1003	机器人 3 号 ♂	22	0	算法	2020-01-01 10:00:00
4	1004	机器人 4 号	25	0	算法	2020-01-01 10:00:00
5	1005	机器人 555 号	4000	7	算法	2020-01-11 10:00:00
6	1006	机器人 6 号	25	0	算法	2020-01-02 11:00:00
7	1007	机器人 7 号	25	0	算法	2020-01-02 11:00:00
8	1008	机器人 8 号	25	0	算法	2020-01-02 11:00:00
9	1009	机器人 9 号	25	0	算法	2020-01-02 11:00:00
10	1010	机器人 10 号	25	0	算法	2020-01-02 11:00:00
11	1011	666666	3000	6	C++	2020-01-02 10:00:00

试卷信息表 examination_info（exam_id：试卷 ID, tag：试卷类别, difficulty：试卷难度, duration：考试时长, release_time：发布时间），示例数据如下：

id	exam_id	tag	difficulty	duration	release_time
1	9001	算法	hard	60	2020-01-01 10:00:00
2	9002	算法	hard	80	2020-01-01 10:00:00
3	9003	SQL	medium	70	2020-01-01 10:00:00

现有试卷作答记录表 exam_record（uid 用户 ID,exam_id 试卷 ID, start_time 开始作答时间, submit_time 交卷时间, score 得分）示例数据如下：

id	uid	exam_id	start_time	submit_time	score
1	1001	9001	2020-01-02 09:01:01	2020-01-02 09:21:59	80
2	1002	9003	2020-01-20 10:01:01	2020-01-20 10:10:01	81
3	1002	9002	2020-01-01 12:11:01	2020-01-01 12:31:01	83
4	1003	9002	2020-01-01 19:01:01	2020-01-01 19:30:01	75
5	1004	9002	2020-01-01 12:01:01	2020-01-01 12:11:01	60
6	1005	9002	2020-01-01 12:01:01	2020-01-01 12:41:01	90
7	1006	9001	2020-01-02 19:01:01	2020-01-02 19:32:00	20
8	1007	9002	2020-01-02 19:01:01	2020-01-02 19:40:01	89
9	1008	9003	2020-01-02 12:01:01	2020-01-02 12:20:01	99
10	1008	9001	2020-01-02 12:01:01	2020-01-02 12:31:01	98
11	1009	9002	2020-01-02 12:01:01	2020-01-02 12:31:01	82
12	1010	9002	2020-01-02 12:11:01	2020-01-02 12:41:01	76
13	1011	9001	2020-01-02 10:01:01	2020-01-02 10:31:01	89

找到求职方向为算法工程师，且注册当天就完成了算法类试卷的人，按参加过的所有考试最高得分排名。排名榜很长，我们将采用分页展示，每页 3 条，现在需要你取出第 3 页（页码从 1 开始）的人的信息。

由示例数据结果输出如下：

uid	register_time	max_score
1010	2020-01-02 11:00:00	76
1003	2020-01-01 10:00:00	75
1004	2020-01-01 11:00:00	60

解释：除了 1011 其他用户的求职方向都为算法工程师；算法类试卷有 9001 和 9002，11 个用户注册当天都完成了算法类试卷；计算他们的所有考试最大分时，只有 1002 和 1008 完成了两次考试，其他人只完成了一场考试，1002 两场考试最高分为 81，1008 最高分为 99。

按最高分排名如下：

uid	level	register_time	max_score
1008	0	2020-01-02 11:00:00	99
1005	7	2020-01-01 10:00:00	90
1007	0	2020-01-02 11:00:00	89
1002	3	2020-01-01 10:00:00	83
1009	0	2020-01-02 11:00:00	82
1001	0	2020-01-01 10:00:00	80
1010	0	2020-01-02 11:00:00	76
1003	0	2020-01-01 10:00:00	75
1004	0	2020-01-01 11:00:00	60
1006	0	2020-01-02 11:00:00	20

每页 3 条，第三页也就是第 7~9 条，返回 1010、1003、1004 的行记录即可。

思路：

每页三条，即需要取出第三页的人的信息，要用到limit
统计求职方向为算法工程师且注册当天就完成了算法类试卷的人的信息和每次记录的得分，先求满足条件的用户，后用 left join 做连接查找信息和每次记录的得分

答案：

SELECT ui.uid,
	     ui.`level`,
			 ui.register_time,
			 MAX(score) AS max_score
FROM exam_record er
INNER JOIN examination_info ei USING(exam_id)
INNER JOIN user_info ui ON er.uid = ui.uid AND DATE(er.submit_time) = DATE(ui.register_time)
WHERE ui.job = '算法'
	AND ei.tag = '算法'
GROUP BY ui.uid,
				 ui.`level`,
				 ui.register_time
ORDER BY max_score DESC
LIMIT 6,3

4、文本转换函数

4.1、修复串列了的记录

试卷信息表 examination_info（exam_id：试卷 ID, tag：试卷类别, difficulty：试卷难度, duration：考试时长, release_time：发布时间），示例数据如下：

id	exam_id	tag	difficulty	duration	release_time
1	9001	算法	hard	60	2021-01-01 10:00:00
2	9002	算法	hard	80	2021-01-01 10:00:00
3	9003	SQL	medium	70	2021-01-01 10:00:00
4	9004	算法,medium,80		0	2021-01-01 10:00:00

录题同学有一次手误将部分记录的试题类别 tag、难度、时长同时录入到了 tag 字段，请帮忙找出这些录错了的记录，并拆分后按正确的列类型输出。

由示例数据结果输出如下：

exam_id	tag	difficulty	duration
9004	算法	medium	80

思路：

先来学习下本题要用到的函数

SUBSTRING_INDEX 函数用于提取字符串中指定分隔符的部分。它接受三个参数：原始字符串、分隔符和指定要返回的部分的数量。

以下是SUBSTRING_INDEX函数的语法：

SUBSTRING_INDEX(str, delimiter, count)

str：要进行分割的原始字符串。
delimiter：用作分割的字符串或字符。
count：指定要返回的部分的数量。
- 如果 count 大于 0，则返回从左边开始的前 count 个部分（以分隔符为界）。
- 如果 count 小于 0，则返回从右边开始的前 count 个部分（以分隔符为界），即从右侧向左计数。

下面是一些示例，演示了 SUBSTRING_INDEX 函数的使用：

提取字符串中的第一个部分：

SELECT SUBSTRING_INDEX('apple,banana,cherry', ',', 1);
-- 输出结果：'apple'

提取字符串中的最后一个部分：

SELECT SUBSTRING_INDEX('apple,banana,cherry', ',', -1);
-- 输出结果：'cherry'

提取字符串中的前两个部分：

SELECT SUBSTRING_INDEX('apple,banana,cherry', ',', 2);
-- 输出结果：'apple,banana'

提取字符串中的最后两个部分：

SELECT SUBSTRING_INDEX('apple,banana,cherry', ',', -2);
-- 输出结果：'banana,cherry'

答案：

SELECT
	exam_id,
	substring_index( tag, ',', 1 ) tag,
	substring_index( substring_index( tag, ',', 2 ), ',',- 1 ) difficulty,
	substring_index( tag, ',',- 1 ) duration
FROM
	examination_info
WHERE
	difficulty = ''

在这里插入图片描述

4.2、对过长的昵称截取处理

描述：现有用户信息表 user_info（uid 用户 ID，nick_name 昵称, achievement 成就值, level 等级, job 职业方向, register_time 注册时间），数据如下：

id	uid	nick_name	achievement	level	job	register_time
1	1001	机器人 1	19	0	算法	2020-01-01 10:00:00
2	1002	机器人 2 号	1200	3	算法	2020-01-01 10:00:00
3	1003	机器人 3 号 ♂	22	0	算法	2020-01-01 10:00:00
4	1004	机器人 4 号	25	0	算法	2020-01-01 11:00:00
5	1005	机器人 567890123 号	4000	7	算法	2020-01-11 10:00:00
6	1006	机器人 67890123456789 号	25	0	算法	2020-01-02 11:00:00

有的用户的昵称特别长，在一些展示场景会导致样式混乱，因此需要将特别长的昵称转换一下再输出，请输出字符数大于 10 的用户信息，对于字符数大于 17 的用户输出前 10 个字符然后加上三个点号：『…』。

由示例数据结果输出如下：

uid	nick_name
1005	机器人 567890123 号
1006	机器人 678901234567…

解释：字符数大于 10 的用户有 1005 和 1006，长度分别为 17、22；因此需要对 1006 的昵称截断输出。

思路：

这题涉及到字符的计算，要计算字符串的字符数（即字符串的长度），可以使用 LENGTH 函数或 CHAR_LENGTH 函数。这两个函数的区别在于对待多字节字符的方式。

LENGTH 函数：它返回给定字符串的字节数。对于包含多字节字符的字符串，每个字符都会被当作一个字节来计算。
示例：

SELECT LENGTH('你好'); -- 输出结果：6，因为 '你好' 中的每个汉字每个占3个字节

CHAR_LENGTH 函数：它返回给定字符串的字符数。对于包含多字节字符的字符串，每个字符会被当作一个字符来计算。
示例：

SELECT CHAR_LENGTH('你好'); -- 输出结果：2，因为 '你好' 中有两个字符，即两个汉字

答案：

SELECT uid,
	  (CASE 
	    WHEN CHAR_LENGTH( nick_name ) > 17 THEN
		CONCAT(SUBSTR(nick_name,1,17),'...') ELSE nick_name
		END) AS nick_name
FROM user_info
WHERE CHAR_LENGTH(nick_name) > 10