遇到一个需求,找出分组后,某个字段最大值的所有记录。因此,很直观的就有了类似下面的sql语句:
方法一:
select * from test as a
where typeindex = (select max(b.typeindex)
from test as b
where a.type = b.type );
方法二:
select a.* from test a,
(select type,max(typeindex) typeindex
from test group by type) b
where a.type = b.type and a.typeindex = b.typeindex order by a.type
上面的sql语句没有什么问题,方法一也比方法二效率略高,但是当面对大量数据时,就会出现问题,执行效率非常慢。笔者960万数据拿来实测,结果半个小时还没完成。原因是上面的sql语句,实现原理是先根据关联字段分组,分组后根据此字段排序,然后查找最大值,再通过关联字段查找所有字段的值。
有没有更好的实现方式呢?有的,可以先根据此字段进行排序,再用关联字段进行分组,好处在于先排序后分组,这里只需要排序一次,因而会快很多。
select distinct 字段 from (
(select * from test order by typeindex desc)
as b) group by b.type);