“分组查询”可以说是相当常见的SQL查询语句,对于MySQL数据库而言,其实现分组查询的关键字为GROUP BY,而在使用GROUP BY期间一般还会有其他的聚合函数配合使用,比如计数用的COUNT(*),统计数值和用的SUM(*),而本文要介绍的是另一种类型的“分组查询”,即分组查询出来后再查询出每一组的前N条数据。
为了方便诸位理解,还是直接举一个实际的案例吧:存在两个数据库表,一个叫课程表course,另一个叫课程类型表course_type,这两个数据库表的DDL(数据库表字段定义)如下所示:
(1)课程类型表:
CREATE TABLE `course_type` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(255) CHARACTER SET utf8mb4 NOT NULL COMMENT '类型名',
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='课程类型';
(2)课程信息表:
CREATE TABLE `course` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`type_id` int(11) NOT NULL COMMENT '类型id',
`name` varchar(255) CHARACTER SET utf8mb4 DEFAULT NULL COMMENT '课程名称',
`scan_total` int(255) DEFAULT NULL COMMENT '课程浏览量',
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='课程信息表';
现在的功能需求是:找出每种课程类型中课程浏览量排名前3的课程记录,而这种场景经常可以在一些在线教育平台中见到,如下图所示为某个在线教育平台中“后端开发”这一大类型里面每种小分类的课程销量排行榜:
接下来,我们将找寻各种方式去实现这一功能需求!
(1)传统的实现方式一般是采用Java代码的方式先查询出每种课程类型数据,然后再遍历每一种课程类型,在课程表中根据课程类型匹配查询出浏览量前3的课程数据,即 type_id=xx order by scan_total desc limit 3;
其代码实现方式在这里就不贴出来了,感兴趣的小伙伴可以自己动手撸一撸!
此种实现方式最终固然可以实现功能需求,但是,有一个不好的地方在于需要在遍历每一种课程类型时不断发出查询课程数据列表的SQL,如果课程类型有10几种,而每一种需要取几十、甚至几百条数据,那将耗费很大的资源(建立数据库链接是需要耗资源的:内存、CPU、网络、磁盘…)
(2)因此,我们转而求其次,采用SQL查询一次性来搞定!在进行实操之前,debug建议诸位先打开Navicat尝试撸一撸,然后再回过头来看看debug提供的实现方式.
为了实现这种功能,我们需要转换下思考的角度:仔细阅读需求,可以得知它是需要我们查找出每种课程类型下课程浏览量前3的课程列表,其实就是找出每个课程在同种课程类型下的浏览量排名,最后再找出每种课程类型下排名前3的课程!
更多请见:http://www.mark-to-win.com/tutorial/51105.html