distinct

[b]1. distinct简介[/b]
在表中,可能会包含重复值。这并不成问题,不过,有时您也许希望仅仅列出不同(distinct)的值。关键词 DISTINCT 用于返回唯一不同的值。

distinct这个关键字用来过滤掉多余的重复记录只保留一条,但[b]往往[/b]只用它来[color=red]返回不重复记录的条数[/color],而[color=red]不是[/color]用它来返回不重记录的[b]所有值[/b]。其原因是distinct只有用二重循环查询来解决,而这样对于一个数据量非常大的站来说,无疑是会直接影响到效率的。

[b]2.使用限制[/b]
1)distinct必须放在select后的第一个字段前
2)distinct的作用范围是select后的所有的字段,而不仅仅是紧挨着的字段。就像联合主键一样,共同保证唯一性。
3)distinct语句中select显示的字段只能是distinct指定的字段,其他字段是不可能出现的。例如,假如表A有“备注”列,如果想获取distinct name,以及对应的“备注”字段,但又不想让“备注”和name共同保证distinct是不行的。有上面两点的限制这一点不难理解。但可以通过其他组合查询的方式得到这种结果。

4)可以在函数里使用distinct,比如:
select p.event_source,count(distinct p.DESCRIPTION) from v_process_info p group by p.EVENT_SOURCE

[b]3. 与group by的性能对比[/b]
这里只是引用了网上几个对比,自己没有验证。说明一点,就算是验证,结论不一定准确,数据库的架构和数据的分布和数量级都会影响到测试结果。结果仅供参考.
1)在mysql中测试,group by比distinct性能好很多。
2)使用索引,同样的关键字下效率提升几十~上百倍。
[url]http://www.cnblogs.com/zox2011/archive/2012/09/12/2681797.html[/url]

在oracle10g之后,group by同样是比distinct性能好。
分析见:[url]http://blog.itpub.net/4227/viewspace-69053/[/url]

tom大师也给出oracle下,group by比distinct性能好些。
[url]http://blog.chinaunix.net/uid-22948773-id-3157019.html[/url]

其他参考:
[url]http://www.jb51.net/article/24717.htm[/url]
[url]http://www.itpub.net/thread-611402-1-1.html[/url]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值