group by 与 distinct去重性能

最新推荐文章于 2025-03-16 20:38:29 发布

chi_666

最新推荐文章于 2025-03-16 20:38:29 发布

阅读量515

点赞数 2

文章标签： oracle 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chi_666/article/details/136229250

版权

GROUP BY和DISTINCT在数据库查询中都可以用于去重，但它们的性能差异取决于多个因素，包括数据集的大小、数据库的结构和索引、以及查询的具体内容。
处理方式：
DISTINCT：它会扫描整个数据集，然后删除重复的记录，只保留唯一的记录。
GROUP BY：它可以在数据流中即时进行去重处理，通常与聚合函数（如COUNT, SUM等）一起使用，但也可以仅用于去重。
性能：
对于小数据集，DISTINCT和GROUP BY的性能差异可能不明显。
对于大数据集，GROUP BY通常比DISTINCT更高效。因为GROUP BY可以即时去重，而DISTINCT需要扫描整个数据集，这可能导致更高的内存和I/O开销，尤其是在处理TB级大表时。
GROUP BY还可以利用索引来加速查询，而DISTINCT通常不会。
内存和I/O开销：
DISTINCT需要扫描整个数据集，这可能导致更高的内存和I/O开销。
GROUP BY在处理过程中可能只需要维护当前的分组，因此内存和I/O开销相对较小。
使用场景：
如果只需要简单地去除重复记录，DISTINCT是一个简单的选择。
如果需要进行聚合操作或其他复杂的查询，GROUP BY通常是更好的选择。
总之，GROUP BY通常比DISTINCT在处理大数据集时具有更高的性能。然而，这并不意味着在所有情况下都应该使用GROUP BY。在选择使用哪种方法时，需要考虑具体的需求和数据库的特性。在某些情况下，使用DISTINCT可能更简单或更直观。

博客等级

码龄7年

128
原创

441
点赞

383
收藏

251
粉丝

关注

私信

热门文章

分类专栏

面试 14篇
JAVA 22篇
SpringBoot 26篇
MyBatis源码分析 33篇
设计模式 4篇
Oracle 13篇
前端 4篇
工具 6篇
ruoyi-vue 2篇
Ant 1篇

展开全部收起

最新评论

maven本地仓库存在jar导包时依然试图远程仓库下载问题解决
qq_43355803: 看了那么多，还是这个最靠谱
MyBatis一次查询请求涉及的执行器流程
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)使用更多的站内链接。
MyBatis执行过程之Exector组件
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加除了各种控件外，文章正文的字数；(3)提升标题与正文的相关性。
Executor执行器可以使用JDBC三个中任意一个的statement吗？
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性；(3)增加除了各种控件外，文章正文的字数。
MyBatis二级缓存的命中条件
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加除了各种控件外，文章正文的字数；(3)提升标题与正文的相关性。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。