乍一看…
所有你需要的是一个具有MAX聚合函数的GROUP BY子句:
SELECT id, MAX(rev)
FROM YourTable
GROUP BY id
它从来没有那么简单,是吗?
我只是注意到你还需要内容列。
这是SQL中一个非常常见的问题:根据某个组标识符,为列中的某个最大值找到整个数据。我在我的职业生涯中听说了很多。其实,这是我在我目前的工作技术面试中回答的问题之一。
实际上,StackOverflow社区创建了一个标签只是为了处理像这样的问题:greatest-n-per-group。
基本上,你有两种方法来解决这个问题:
加入简单的组标识符,组中的最大值子查询
在这种方法中,首先在子查询中找到group-identifier,max-value-in-group(上面已经解决)。然后将您的表连接到group-identifier和group-max-value-in-group上的相等的子查询:
SELECT a.id, a.rev, a.contents
FROM YourTable a
INNER JOIN (
SELECT id, MAX(rev) rev
FROM YourTable
GROUP BY id
) b ON a.id = b.id AND a.rev = b.rev
左加入自我,调整连接条件和过滤器
在这种方法中,你离开连接表与自己。平等,当然,在组标识符。然后,2智能移动:
>第二个连接条件的左侧值小于右侧值
>执行步骤1时,实际具有最大值的行在右侧将具有NULL(它是一个左连接,记住吗?)。然后,我们过滤连接的结果,只显示右侧为NULL的行。
所以你最终得到:
SELECT a.*
FROM YourTable a
LEFT OUTER JOIN YourTable b
ON a.id = b.id AND a.rev < b.rev
WHERE b.id IS NULL;
结论
两种方法都带来完全相同的结果。
如果组标识符具有两行具有组中的max-value-in-group,则两种方法都将出现在两个方法的结果中。
这两种方法都是SQL ANSI兼容的,因此,将与您最喜欢的RDBMS,无论其“风味”工作。
这两种方法也都是性能友好的,但是您的里程可能不同(RDBMS,DB结构,索引等)。所以当你选择一种方法,另一种,基准。并确保你选择对你最有意义的那个。