sql:对单个字段去重,distinct和group by性能分析

distinct简单来说就是用来去重的,而group by的设计目的则是用来聚合统计的,两者在能够实现的功能上有些相同之处,但是2者的性能差距很大

对于一个84万数据量的表,count(distinct(XXX))的查询需要20s,而group by仅需1s,性能相差20倍

 

原理分析:

        distinct方式就是两两对比,需要遍历整个表,大多数情况下都会导致对最终结果集进行一次排序;

        group by分组类似先建立索引再查索引,所以两者对比,小表distinct快,不用索引。大表group by快。一般来说小表就算建索引,也不会慢到哪儿去;但如果是TB级大表,遍历简直就是灾难。

        所以distinct一直是sql语言中成本最高的函数之一,很多Oracle项目都禁止使用distinct语句,全部要求替换成group by。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值