用途:
GROUP BY 语句用于 对一个或多个列对结果集进行分组。
例子:
原表:
CREATE TABLE `t_iov_help_feedback` (
`ID` INT(11) NOT NULL AUTO_INCREMENT COMMENT '主键ID',
`USER_ID` INT(255) DEFAULT NULL COMMENT '用户ID',
`problems` VARCHAR(255) DEFAULT NULL COMMENT '问题描述',
`last_updated_date` DATETIME DEFAULT NULL COMMENT '最后更新时间',
PRIMARY KEY (`ID`)
) ENGINE=INNODB DEFAULT CHARSET=utf8;
现在,我们希望根据USER_ID 字段进行分组,那么,可使用 GROUP BY 语句。
我们使用下列 SQL 语句:
SELECT ID,USER_ID,problems,last_updated_date
FROM t_iov_help_feedback
GROUP BY USER_ID;
结果集类似这样:
可以看到上面的,结果的确是根据 USER_ID 进行分组了,但是返回的记录是 USER_ID 对应的每组 中最小的那条记录。也就是ID最小的那条。
现在我想分组后得到,last_updated_date 最大的那条记录。这怎么实现呢?
很简单,直接查询的表默认是以 ID 进行顺序排序的,因为分组的时候取的是每组中的第一条。所以只需要 使查询的表 按照 last_updated_date 倒叙排序就行了。
实现的SQL如下,这里使用了嵌套查询。
SELECT ID,USER_ID,problems,last_updated_date
FROM (select * from t_iov_help_feedback order by USER_ID, LAST_UPDATED_DATE DESC) b
GROUP BY b.USER_ID;
其中:select * from t_iov_help_feedback order by USER_ID, LAST_UPDATED_DATE DESC 就相当于一个按照USER_ID升序, last_updated_date倒叙排序的表了。
查询结果如下:
现在取的就是每组中时间最大的那条记录了。
备注:
当遇到两个不同的表时,可以使用以下SQL:
select a.title, t.name, t.price from a
inner join (select * from b order by id, price ) t on t.id = a.b_id
group by a.b_id;
由于评论区讨论比较激烈,所以2021年我追加了下面的内容~
注意:
上述方案是基于mysql 版本5.5.40实现的,在高版本的mysql不一定可以。
1、语法问题
SELECT ID,USER_ID,problems,last_updated_date FROM table_X GROUP BY b.USER_ID; 这样的语句在mysql 5.7 版本及以上是不通过的,
报错如下:
这是因为mysql 版本高于5.7.5时,默认设置的 sql_mode 模式是:only_full_group_by。这种情况怎么解决见我的另外篇文章:
MySQL错误-this is incompatible with sql_mode=only_full_group_by完美解决
2、效果问题
高版本的mysql,就算跳过了语法检查,执行的效果还是没有的,没有得到时间最新的那条数据。
在8.0.16的mysql版本中举个例子:
表中所有数据如下
INSERT INTO `t_iov_help_feedback`(`ID`, `USER_ID`, `problems`, `last_updated_date`) VALUES (1, 1, '时间比较小', '2021-02-23 10:11:49');
INSERT INTO `t_iov_help_feedback`(`ID`, `USER_ID`, `problems`, `last_updated_date`) VALUES (2, 2, '时间小', '2021-02-23 10:12:49');
INSERT INTO `t_iov_help_feedback`(`ID`, `USER_ID`, `problems`, `last_updated_date`) VALUES (3, 3, '我乱写的', '2021-02-23 11:19:19');
INSERT INTO `t_iov_help_feedback`(`ID`, `USER_ID`, `problems`, `last_updated_date`) VALUES (4, 1, '时间比较大', '2021-02-23 11:16:01');
INSERT INTO `t_iov_help_feedback`(`ID`, `USER_ID`, `problems`, `last_updated_date`) VALUES (5, 2, '时间大', '2021-02-23 11:19:13');
可以看到,USER_ID为1和2都有重复数据。
USER_ID为1 时间最大的条记录为 2021-02-23 11:16:01,USER_ID为2 时间最大的条记录为 2021-02-23 11:19:13。
执行上述语句结果为:
对于UER_ID重复数据,可以看到,分组后没有得到时间较大的那一条记录。
这时,怎么办呢?请见我的另外一篇文章: