MySQL 实战 - 复杂项目

最新推荐文章于 2024-04-10 21:00:21 发布

Danny-南良

最新推荐文章于 2024-04-10 21:00:21 发布

阅读量297

点赞数

分类专栏：大数据

本文链接：https://blog.csdn.net/qq_43281792/article/details/88320264

版权

大数据专栏收录该内容

8 篇文章 0 订阅

订阅专栏

项目十：行程和用户（难度：困难）

Trips 表中存所有出租车的行程信息。每段行程有唯一键 Id，Client_Id 和 Driver_Id 是 Users 表中 Users_Id 的外键。Status 是枚举类型，枚举成员为 (‘completed’, ‘cancelled_by_driver’, ‘cancelled_by_client’)。
Users 表存所有用户。每个用户有唯一键 Users_Id。Banned 表示这个用户是否被禁止，Role 则是一个表示（‘client’, ‘driver’, ‘partner’）的枚举类型。

任务：

写一段 SQL 语句查出 2013年10月1日至 2013年10月3日期间非禁止用户的取消率。基于上表，你的 SQL 语句应返回如下结果，取消率（Cancellation Rate）保留两位小数。

解析：

题目意思本身很简单，难点在于如何同时计算取消的数量和总数量。总数量很简单，就是COUNT(*)，同时计算取消数量可以用SUM(CASE END)来实现。对status列计算数量，如果是cancel就记1，complete记为0.

P.S. 如果需要userID 匹配 clientID和driverID两列，需要写两个Lef Join。但是可以通过CASE ...END 在最终结果只显示一列。

代码:

-- 创建Trips表
CREATE TABLE Trips(
id INT PRIMARY KEY,
Client_id INT,
Driver_id INT,
City_id INT,
Status ENUM('completed','cancelled_by_driver','cancelled_by_client'),
Request_at VARCHAR(50)
);

-- 插入数据
INSERT INTO Trips VALUES ('1', '1', '10', '1', 'completed', '2013-10-01');
INSERT INTO Trips VALUES ('2', '2', '11', '1', 'cancelled_by_driver', '2013-10-01');
INSERT INTO Trips VALUES ('3', '3', '12', '6', 'completed', '2013-10-01');
INSERT INTO Trips VALUES ('4', '4', '13', '6', 'cancelled_by_client', '2013-10-01');
INSERT INTO Trips VALUES ('5', '1', '10', '1', 'completed', '2013-10-02');
INSERT INTO Trips VALUES ('6', '2', '11', '6', 'completed', '2013-10-02');
INSERT INTO Trips VALUES ('7', '3', '12', '6', 'completed', '2013-10-02');
INSERT INTO Trips VALUES ('8', '2', '12', '12', 'completed', '2013-10-03');
INSERT INTO Trips VALUES ('9', '3', '10', '12', 'completed', '2013-10-03');
INSERT INTO Trips VALUES ('10', '4', '13', '12', 'cancelled_by_driver', '2013-10-03');

-- 查看Trips表
SELECT * FROM Trips; 

-- 创建Users表
CREATE TABLE Users(
Users_id INT PRIMARY KEY,
Banned varchar(20),
Role ENUM('client','driver','partner')
);

-- 插入数据
INSERT INTO Users VALUES ('1',  'No',  'client');
INSERT INTO Users VALUES ('2',  'Yes', 'client');
INSERT INTO Users VALUES ('3',  'No',  'client');
INSERT INTO Users VALUES ('4',  'No',  'client');
INSERT INTO Users VALUES ('10', 'No',  'driver');
INSERT INTO Users VALUES ('11', 'No',  'driver');
INSERT INTO Users VALUES ('12', 'No',  'driver');
INSERT INTO Users VALUES ('13', 'No',  'driver');

-- 查看Users表
SELECT * FROM users;

-- 解答
SELECT t.Request_at AS Day,
ROUND(sum((CASE WHEN t.Status LIKE 'cancelled%' THEN 1 ELSE 0 END))/count(*),2) AS 'Cancellation Rate' 
-- 如果是取消的就为1，否则为0，sum求和后除以当天的总单数，即为取消率。Round函数用来保留两位小数。
FROM Trips t
INNER JOIN Users u ON u.Users_Id =t.Client_Id AND u.Banned = 'No' -- 连接两张表
--或者可以使用这种方法
--WHERE Client_Id NOT IN (SELECT Users_Id FROM Users WHERE Banned = 'YES')

GROUP BY t.Request_at; -- 以订单时间分组

项目十一：各部门前3高工资的员工（难度：中等）

将前一个项目中employee表清空，重新插入以下数据，编写一个 SQL 查询，找出每个部门工资前三高的员工。

解析：

和昨天分数排名的思想类似，用到了辅助表。 emp1是我们的基础表，emp2是辅助表。将emp1里的每个salary和整张emp2比较。下面来捋下过程。

以IT部门为例，emp1的salary有 6.9万，7万，8.5万，9万四个数

① emp1工资是6.9万的时候，emp2表里的 count是3，说明有三个大于它的（间接说明它是第四大）

② emp1工资是7万的时候，emp2表里的count是2，说明有两个大于它的（间接说明它是第三大）

③emp1工资是8.5万的时候，emp2表里的count是1，说明有1个大于它的（间接说明它是第二大）

④emp1工资是9万的时候，emp2表里的count是0，说明没有大于它的（间接说明它是最大的）

在code里就是emp2.Salary > （emp1.Salary =6.9）然后我们要求的是前三大，所以是COUNT() < 3。

代码：

TRUNCATE TABLE Employee;           -- 清除数据

-- 插入数据
INSERT INTO employee VALUES (1,'Joe',70000,1);
INSERT INTO employee VALUES (2,'Henry',80000,2);
INSERT INTO employee VALUES (3,'Sam',60000,2);
INSERT INTO employee VALUES (4,'Max',90000,1);
INSERT INTO employee VALUES (5,'Janet',69000,1);
INSERT INTO employee VALUES (6,'Randy',85000,1);
SELECT *FROM employee

SET @limit_n = 3;  -- 定义变量，筛选各部门前N个工资最高的人
SELECT
  d. NAME Department,
  e. NAME Employee,
  e.Salary
FROM
  Employee e
INNER JOIN Department d ON e.DepartmentId = d.ID
WHERE
  (
    SELECT
      COUNT(1)
    FROM
      Employee e2
    WHERE
      e2.DepartmentID = d.ID
    AND e2.Salary > e.Salary
  ) < @limit_n
ORDER BY Department DESC;  -- 排序

项目十二：分数排名（难度:中等）

依然是昨天的分数表，实现排名功能，但是排名是非连续的，如下：

解析：

因为需要不连续的，所以count(*)取表中总记录数即可，之后统计多少个人比这个分数高，对结果+1后即为排名。因为比如对于最高分，没有人比他高，所以结果是0，排名需要+1才可以。并且使用format函数可以对结果强制保留几位小数输出。

代码：

SELECT FORMAT(Score,2),
(SELECT count(*) FROM Score AS s2 WHERE s2.Score > s1.Score)+1 AS Rank 
FROM Score AS s1
ORDER BY Score DESC;

Danny-南良

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
MySQL 实战 - 复杂项目

目录项目十：行程和用户（难度：困难）项目十一：各部门前3高工资的员工（难度：中等）项目十二：分数排名（难度:中等）项目十：行程和用户（难度：困难）Trips 表中存所有出租车的行程信息。每段行程有唯一键 Id，Client_Id 和 Driver_Id 是 Users 表中 Users_Id 的外键。Status 是枚举类型，枚举成员为 (‘completed’, ‘canc...
复制链接

扫一扫