1.前言
今天在工作中,查询数据库的时候遇到一个问题,在做数据查询最后去重出来的结果数据,与excel去重出来的数据结果不一致。好奇怪。想了半天,excel应该不会错,那么错的就是sql语句的逻辑,那么逻辑哪里错了呢?想想之前我在看sql面试题的时候好像有个执行顺序的,所以我在网上查了一下,果然问题找到了。
2.情景复现
select DISTINCT(code) from kk_poi where code in ('10001','11002','10002') limit 50;
这串代码相信学过sql的人都能看得懂,我想要从库中筛选出code为10001、11002、10002的数据并且返回前50条并且在这50条内去重。这是我的思路。但是我把这50条没去重的数据拿出来放在excel中进行去重的时候发现了问题,我发现如果用sql语句去重那么它去重的结果数为47,为啥用excel语句去重它返回的结果数只有10几条呢?
其实我一开始想法是对的,其实这个语句存在的问题就是我忽略了它distinct和limit的执行顺序
上面的语句是先执行distinct然后在执行limit的。好,带到上面的代码逻辑来看,它是先把code为10001、11002、10002的数据查出来,然后它不进行limit而是先进行去重,那么它和我的想法就偏离了,它是对查出来的1001、11002、10002的所有数据进行去重,而不是对我查出来的50条进行去重。所以产生了这个问题。
所以对上述语句他是先执行distinct再执行limit所产生的错误!!!
那么如果想要先对数据limit然后在distinct那则么做呢?
好办,那我就用子查询
select DISTINCT(code) from (select * from kk_poi where code in ('10001','11002','10003') limit 50) t;
3. 总结
对于Sql语句虽然是基础,来是要多多写,多多去分析,多多去理解。