select t1.GroupID,t1.OrderID from t t1
left join t t2 on t1.GroupID=t2.GroupID and t1.OrderID>t2.OrderID
group by t1.GroupID,t1.OrderID having count(t2.OrderID)<2 order by t1.GroupID,t1.OrderID
主要的思想是先构建数据表;
将组内(GroupID)按照条件(t1.OrderID>t2.OrderID)笛卡尔;
从而t1.OrderID越大,组内满足条件的记录就越多;依次多一条;
再通过t1表(GroupID,OrderID)分组集合计算,小于一定数量(N);
最后得到的就是分组前N条记录。
这种方法的性能主要取决于构建表的大小;
值得注意的是以往写SQL都是为了缩小查询范围,而此方法是先构建数据放大查询范围,然后再组合计算;
这里之所以没有用join和>=,而用的left join 和 >,主要考虑到缩减了构建表的记录条数;
当然还有其他的方法,如:
select * from t t1
where 2>(select count(0) from t t2
where t2.GroupID=t1.GroupID and t1.OrderID>t2.OrderID)
order by t.GroupID,t.OrderID
其原理是利用条件中的语句(括号内的语句)可以使用主表(括号外的表)的字段作为条件判断表达式的项;
这种方法的缺点是括号内的语句将被执行N次,N取决于括号外的表的记录条数;
综上的方法虽然从SQL的角度解决了分组前N条的需求,但是从性能的角度上来说并不理想;
目前最好的解决方法还是用程序先取组,再通过组取前N条;