distinct

最新推荐文章于 2021-01-19 08:45:07 发布

iteye_12702

最新推荐文章于 2021-01-19 08:45:07 发布

阅读量547

点赞数

分类专栏：数据库-通用文章标签： distinct与group by 性能对比

数据库-通用专栏收录该内容

8 篇文章 0 订阅

订阅专栏

[b]1. distinct简介[/b]
在表中，可能会包含重复值。这并不成问题，不过，有时您也许希望仅仅列出不同（distinct）的值。关键词 DISTINCT 用于返回唯一不同的值。

distinct这个关键字用来过滤掉多余的重复记录只保留一条，但[b]往往[/b]只用它来[color=red]返回不重复记录的条数[/color]，而[color=red]不是[/color]用它来返回不重记录的[b]所有值[/b]。其原因是distinct只有用二重循环查询来解决，而这样对于一个数据量非常大的站来说，无疑是会直接影响到效率的。

[b]2.使用限制[/b]
1）distinct必须放在select后的第一个字段前
2）distinct的作用范围是select后的所有的字段，而不仅仅是紧挨着的字段。就像联合主键一样，共同保证唯一性。
3）distinct语句中select显示的字段只能是distinct指定的字段，其他字段是不可能出现的。例如，假如表A有“备注”列，如果想获取distinct name，以及对应的“备注”字段，但又不想让“备注”和name共同保证distinct是不行的。有上面两点的限制这一点不难理解。但可以通过其他组合查询的方式得到这种结果。

4）可以在函数里使用distinct,比如：
select p.event_source,count(distinct p.DESCRIPTION) from v_process_info p group by p.EVENT_SOURCE

[b]3. 与group by的性能对比[/b]
这里只是引用了网上几个对比，自己没有验证。说明一点，就算是验证，结论不一定准确，数据库的架构和数据的分布和数量级都会影响到测试结果。结果仅供参考.
1）在mysql中测试，group by比distinct性能好很多。
2）使用索引，同样的关键字下效率提升几十~上百倍。
[url]http://www.cnblogs.com/zox2011/archive/2012/09/12/2681797.html[/url]

在oracle10g之后，group by同样是比distinct性能好。
分析见：[url]http://blog.itpub.net/4227/viewspace-69053/[/url]

tom大师也给出oracle下，group by比distinct性能好些。
[url]http://blog.chinaunix.net/uid-22948773-id-3157019.html[/url]

其他参考：
[url]http://www.jb51.net/article/24717.htm[/url]
[url]http://www.itpub.net/thread-611402-1-1.html[/url]