mysql查询表中最新的一条记录总结
在使用数据库的时候,经常会遇到如下问题:
比如有一张表A,字段和数据如下:
姓名(name) | 身份证号(唯一标识)(id) | 购买产品(pro) | 价格(price) | 数量(count) | 购买时间(time) |
---|---|---|---|---|---|
张1 | 111111 | Computer | 1600 元 | 5 | 2018-03-03 |
张1 | 111111 | Phone | 12 元 | 12 | 2018-03-05 |
张2 | 222222 | Pipe | 1 元 | 234 | 2018-03-04 |
张2 | 222222 | Computer | 1600 元 | 5 | 2018-03-05 |
张3 | 333333 | Phone | 12 元 | 12 | 2018-03-03 |
张3 | 333333 | Pipe | 1 元 | 234 | 2018-03-06 |
张3 | 333333 | Computer | 1600 元 | 5 | 2018-03-08 |
张4 | 444444 | Phone | 12 元 | 12 | 2018-03-09 |
张5 | 555555 | Pipe | 1 元 | 234 | 2018-03-02 |
此时我需要查询表中每一个用户在最后一次都购买了什么产品及产品相关信息。
具体实现方法有三种:
方法1:最简单的一种实现方式;
select * from ( select * from A order by time ) a group by a.id
解释:
首先对A表进行按照时间的排序,排序之后再嵌套一层查询,该层查询使用group by 语句。在使用group by语句的时候,它会按照分组将你排过序的数据的第一条取出来,这样就符合条件了。
此种方法经过实验,在添加索引的情况下,使用起来效率较快,经测试6万笔数据查询时间在三秒钟左右。
方法2:使用内关联的方式;
select * from A inner join ( select id,max(time) as 'tempTime' from A group by id ) temp on temp.id = A.id and temp.tempTime = time
解释:该方法使用内关联实现;两张表进行内关联时,数据库不以某一张表为基础,直接将关联字段相等的数据查询出来;对于表temp来说,该表查询出的结果是id唯一和该id对应的最大时间,关联字段为id和time ,所以在和表A关联的时候,会查询A表中id和最大时间,这样匹配的结果就符合我们的要求了。但是这个查询方式有一个问题,就是在有脏数据的时候,比如有两条张1数据,它的
time、id、等字段全部相同,那么查询出的结果数量就不正确;但是使用方法1就不会出这种问题。
方法3:使用not exists:
select * from A as a1 where not exists(select 1 from A as a2 where a1.id =a2.id
and a2.time<a1.time)
解释:该方法可以通过自己的时间和自己的时间进行比较,通过时间比较将结果查询出来,这种实现方式有两个问题,第一
如果业务数据
存在脏数据,则查询结果数量不正确,第二是查询时间较长,一个5万
笔数据的表该查询方法需要使用30s+;