[b]1. distinct简介[/b]
在表中,可能会包含重复值。这并不成问题,不过,有时您也许希望仅仅列出不同(distinct)的值。关键词 DISTINCT 用于返回唯一不同的值。
distinct这个关键字用来过滤掉多余的重复记录只保留一条,但[b]往往[/b]只用它来[color=red]返回不重复记录的条数[/color],而[color=red]不是[/color]用它来返回不重记录的[b]所有值[/b]。其原因是distinct只有用二重循环查询来解决,而这样对于一个数据量非常大的站来说,无疑是会直接影响到效率的。
[b]2.使用限制[/b]
1)distinct必须放在select后的第一个字段前
2)distinct的作用范围是select后的所有的字段,而不仅仅是紧挨着的字段。就像联合主键一样,共同保证唯一性。
3)distinct语句中select显示的字段只能是distinct指定的字段,其他字段是不可能出现的。例如,假如表A有“备注”列,如果想获取distinct name,以及对应的“备注”字段,但又不想让“备注”和name共同保证distinct是不行的。有上面两点的限制这一点不难理解。但可以通过其他组合查询的方式得到这种结果。
4)可以在函数里使用distinct,比如:
select p.event_source,count(distinct p.DESCRIPTION) from v_process_info p group by p.EVENT_SOURCE
[b]3. 与group by的性能对比[/b]
这里只是引用了网上几个对比,自己没有验证。说明一点,就算是验证,结论不一定准确,数据库的架构和数据的分布和数量级都会影响到测试结果。结果仅供参考.
1)在mysql中测试,group by比distinct性能好很多。
2)使用索引,同样的关键字下效率提升几十~上百倍。
[url]http://www.cnblogs.com/zox2011/archive/2012/09/12/2681797.html[/url]
在oracle10g之后,group by同样是比distinct性能好。
分析见:[url]http://blog.itpub.net/4227/viewspace-69053/[/url]
tom大师也给出oracle下,group by比distinct性能好些。
[url]http://blog.chinaunix.net/uid-22948773-id-3157019.html[/url]
其他参考:
[url]http://www.jb51.net/article/24717.htm[/url]
[url]http://www.itpub.net/thread-611402-1-1.html[/url]
在表中,可能会包含重复值。这并不成问题,不过,有时您也许希望仅仅列出不同(distinct)的值。关键词 DISTINCT 用于返回唯一不同的值。
distinct这个关键字用来过滤掉多余的重复记录只保留一条,但[b]往往[/b]只用它来[color=red]返回不重复记录的条数[/color],而[color=red]不是[/color]用它来返回不重记录的[b]所有值[/b]。其原因是distinct只有用二重循环查询来解决,而这样对于一个数据量非常大的站来说,无疑是会直接影响到效率的。
[b]2.使用限制[/b]
1)distinct必须放在select后的第一个字段前
2)distinct的作用范围是select后的所有的字段,而不仅仅是紧挨着的字段。就像联合主键一样,共同保证唯一性。
3)distinct语句中select显示的字段只能是distinct指定的字段,其他字段是不可能出现的。例如,假如表A有“备注”列,如果想获取distinct name,以及对应的“备注”字段,但又不想让“备注”和name共同保证distinct是不行的。有上面两点的限制这一点不难理解。但可以通过其他组合查询的方式得到这种结果。
4)可以在函数里使用distinct,比如:
select p.event_source,count(distinct p.DESCRIPTION) from v_process_info p group by p.EVENT_SOURCE
[b]3. 与group by的性能对比[/b]
这里只是引用了网上几个对比,自己没有验证。说明一点,就算是验证,结论不一定准确,数据库的架构和数据的分布和数量级都会影响到测试结果。结果仅供参考.
1)在mysql中测试,group by比distinct性能好很多。
2)使用索引,同样的关键字下效率提升几十~上百倍。
[url]http://www.cnblogs.com/zox2011/archive/2012/09/12/2681797.html[/url]
在oracle10g之后,group by同样是比distinct性能好。
分析见:[url]http://blog.itpub.net/4227/viewspace-69053/[/url]
tom大师也给出oracle下,group by比distinct性能好些。
[url]http://blog.chinaunix.net/uid-22948773-id-3157019.html[/url]
其他参考:
[url]http://www.jb51.net/article/24717.htm[/url]
[url]http://www.itpub.net/thread-611402-1-1.html[/url]