[sql优化tip]基数小的列也可能通过索引获得很大的性能提升

即使基数很低的列,如果需要查的具体值是占总数的小部分时,在列上设置索引也能起到很好的效果。

最近在工作中遇到了这么一个场景,抽象描述下。

有一个包含状态信息列的表,只有两种status。值分别为0和1。分别代表processing和done。应为业务特点,新进入的行都是processing的,当结束后,即变为done进行归档。因此有大量的done记录,以及很少量的processing。

有一个业务需求是要取出任意一个processing中的记录然后返回给用户进行展示,因此对应的sql语句差不多就是:

select * from the_table where `status` = 0 limit 1

上线的时候没有注意对应的处理,然后发现单个rpc请求居然要耗时500ms,实在是太夸张了。

当时和同事讨论,同事认为这个列的基数或说区分度只有2,建索引的意义不是很大。书上看到的也是说一般在基数很大的时候建,效果会好。

在测试环境的表截张图,差不多就这个情况:

但我从B树索引的原理上思考,虽然只有0和1两个值,但是因为0的实时数量非常的少,而我们只需要找这个很少的值,所以B树可以锁定少的几条边定位到对应的数据:

然后就在线上数据库提交建了个索引。

然后,对应接口的延迟看看效果。

太强了。

总结:索引能不能起到很好的效果主要看的是会被检索的值占的总量的比例,如果都有可能被检索到时才是基数越大越好。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SQL优化中使用索引是一种常见的方法。索引可以加快数据库的查询速度和性能。下面是一些使用索引进行SQL优化的常见技巧: 1. 选择合适的进行索引:通常情况下,需要在经常用于查询条件的上创建索引。选择经常用于筛选、排序或连接操作的可以提高查询性能。 2. 避免过多的索引:虽然索引可以提高查询速度,但过多的索引会增加数据库的维护成本并降低写入性能。只创建必要的索引,避免不必要的进行索引。 3. 多索引优化:对于经常一起使用的,可以创建多索引以提高查询性能。多索引可以更好地满足复杂查询条件。 4. 聚簇索引优化:聚簇索引是一种特殊的索引类型,它可以将数据物理上组织在一起。通过合理地选择聚簇索引,可以减少磁盘IO和提高查询性能。 5. 使用覆盖索引:覆盖索引是指索引包含了查询所需的所有。通过使用覆盖索引,可以减少数据库的访问次数,从而提高查询性能。 6. 定期更新统计信息:统计信息用于查询优化器选择合适的索引和执行计划。定期更新统计信息可以确保查询优化器能够做出更准确的选择,提高查询性能。 7. 避免索引过度优化:有时候过度使用索引可能会导致性能下降。当数据量较小或查询频率低时,可以考虑不使用索引或者使用覆盖索引来避免过度优化带来的性能问题。 需要注意的是,索引的创建和维护会增加额外的开销,因此在使用索引进行优化时需要综合考虑查询频率、数据量和维护成本等因素。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值