如何创建高效的索引

zyjzyjjyzjyz

已于 2023-11-07 16:59:35 修改

阅读量45

点赞数 2

文章标签： mysql b+树数据库 sql

于 2023-11-05 17:34:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zyjzyjjyzjyz/article/details/134231548

版权

新手一定要注意索引不是万能的，不要瞎创建索引，以前的文章也说过，在mysql的InnoDB中索引就是数据，数据就是索引，索引建多了占存储空间（在任何数据库中索引都是实际的数据，它会占空间）。

在空间上的浪费说完了，再说说时间上，每次对表中的数据进行增删改操作时，都需要去修改各个B+树索引。

总的来说一个表上索引建的越多，就会占用更多的存储空间。在增删改记录的时候性能就越差。

具体索引的结构可以看：《MySQL是怎样运行的：从根儿上理解MySQL》阅读笔记————5.InnoDB数据页结构-CSDN博客

索引在查询中的作用

一个索引就是一个B+Tree，索引可以让我们快速定位记录，加快查询速度。

索引列的类型尽量小

1）整数类型：tinyint，smallint，int，bigint。占用的存储空间是主键增加的。

2）选择较小数据类型创建列的好处

查询带来性能上的一些提升

数据类型小一个数据页可以容纳更多的记录，从而较少io小号。

3）主键类型选择小类型非常重要

主键值，不仅是在聚簇索引中存储，其他的二级索引上的节点上会存储主键值，选择较小的主键数据类型，可以节省存储空间。

索引列的选择性尽量高

索引列的选择性是指在一个数据库表中，某个特定列的值的唯一性和多样性程度。

索引列的选择性：选择性=不同值的数据量 / 总行数，选择性介于0-1之间的值。

索引选择性计算方式：

select count(distinct name) / count(*) from emp;

注意：distinct name

select distinct age from nul_test;

看着是null值也查询出来了，但是count（distinct age）的时候，不会把null算进去（也就是说在算选择性的时候不会把null算进去）——在mysql中null有特殊的概念，下一文章会讲。

select count(distinct age) from nul_test;

选择性高低的区别：

选择性越高，表示该列中的值多样化，就是唯一值特别多’

选择性越低，表示重复值较多

选择性高的索引，可以让mysql在查询时过滤掉更多的行，唯一性索引的选择性1。

前缀索引的使用：

针对text，很长的varchar类型，mysql不支持索引它们全部的长度，需要建立前缀索引。

语法：

alter table tablename add key indexname(字段(长度));

使用上述公式计算不通前缀长度，的选择性，选择一个选择性适合的（高，且短）

select count(distinct left(order_note,3)) / count(*) from orders；

选择到合适的长度，创建前缀索引

alter table orders add key inx_not(order_not(14));

前缀索引的缺点给：mysql中无法使用前缀索引做order by、group by，也无法使用前缀索引进行索引覆盖。

联合索引（多列索引）

联合索引的创建原则：

1、选择性高的列放在最前面，因为可以更好的筛选数据，减少检索的数据量

2、根据运行频率最高的查询（sql），来调整索引列的顺序

3、覆盖查询需要的列，创建联合索引的时候，要注意这个联合索引是否是一个覆盖索引，可以避免回表。

4、避免冗余索引：如果已经有了一个联合索引，在创建一个包含该索引一部分的索引是没必要的，在创建增加维护成本。

5、避免使用太多列

6、只对在查询条件中被经常使用，或者排序分组中经常使用的字段，去创建索引

三星索引：

三星索引并不像上面的索引，三星索引就像是个概念，就像数据库开发的三范式。

针对查询而言，一个三星索引，可能是其最好的索引。

三星索引需要满足的条件：

一星：让索引片尽量变窄，扫描的范围越小越好。通俗的意思就是创建普通索引选择性一定要高，创建联合索引第一列的选择性一定要高，扫描更少的数据

二星：当查询有order by，使用索引，因为索引就是有序的，就不用另外排序

三星：尽量使用覆盖索引，查询不需要回表，减少io次数

遇到查询语句可以先评估这个查询使用到的索引是几颗星的（最少也要满足两颗星）。

B+树索引适用于下边这些情况：

全值匹配

匹配左边的列

匹配范围值

精确匹配某一列并范围匹配另外一列

用于排序

用于分组

使用索引需要注意：

只为用于搜索、排序或者分组的列创建索引

在选择性好的列上建索引

索引列的类型尽量小

可以支队字符串值的前缀建立索引

只有索引列在比较表达式中单独出现才使用索引（避免运算和函数）

主键自增

定位并删除表中的重复和冗余索引（别建已经存在的索引，例如联合索引最左面的列，不要再单独建索引）

尽量使用覆盖索引进行查询，避免回表

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
如何创建高效的索引

通俗的意思就是创建普通索引选择性一定要高，创建联合索引第一列的选择性一定要高，扫描更少的数据。主键值，不仅是在聚簇索引中存储，其他的二级索引上的节点上会存储主键值，选择较小的主键数据类型，可以节省存储空间。4、避免冗余索引：如果已经有了一个联合索引，在创建一个包含该索引一部分的索引是没必要的，在创建增加维护成本。3、覆盖查询需要的列，创建联合索引的时候，要注意这个联合索引是否是一个覆盖索引，可以避免回表。选择性高的索引，可以让mysql在查询时过滤掉更多的行，唯一性索引的选择性1。
复制链接

扫一扫

博客等级

码龄1年

44
原创

618
点赞

433
收藏

733
粉丝

关注

私信

热门文章

分类专栏

《Mysql是怎么运行的：从跟上理解mysql》阅读笔记 3篇

最新评论

Linux新增磁盘分区挂载方法（一文搞定磁盘分区挂载）
CSDN-Ada助手: 恭喜作者发布了这篇关于Linux新增磁盘分区挂载方法的博客，内容非常实用！希望作者能继续分享更多关于Linux系统的知识，也可以考虑写一些关于网络配置或者系统优化的文章，期待您的下一篇作品。谢谢您的分享！
sql中exists和in的区别
CSDN-Ada助手: 恭喜你写了第18篇博客！标题“sql中exists和in的区别”非常有吸引力。阐述了exists和in在SQL中的区别，对于我们理解和应用这两个关键词非常有帮助。我很欣赏你持续创作的努力，写了这么多有价值的博客文章。你的解释清晰明了，对读者来说非常易懂。希望你能继续保持这样的创作热情，分享更多有关SQL或其他相关话题的知识。作为下一步的创作建议，我建议你可以考虑深入研究一些高级的SQL语句和技巧，或者探索一些与SQL相关的新兴技术。这样不仅可以增加你的专业知识储备，也能为读者提供更多的价值。期待你未来更多精彩的博客！
JOIN算法原理及优化
CSDN-Ada助手: 非常感谢作者分享关于JOIN算法的原理和优化的博客，内容非常有深度和实用性。希望作者能够继续保持创作的热情，分享更多关于算法优化和数据处理方面的知识。下一步建议可以考虑结合实际案例，深入探讨JOIN算法在不同场景下的应用与优化技巧，期待作者更多的精彩内容。
慢日志查询
CSDN-Ada助手: 恭喜您写下了第16篇博客！标题“慢日志查询”非常吸引人，我对您的持续创作精神表示赞赏。您的博客内容一定对读者来说非常有价值，因为慢日志查询在现代技术领域中扮演着重要的角色。在下一步的创作中，我建议您可以进一步探索慢日志查询的实际应用场景，例如如何优化数据库性能、如何识别和解决慢查询等等。同时，您也可以考虑分享一些实用的查询技巧和工具，帮助读者更好地理解和应用慢日志查询。期待您未来更多精彩的博客，继续保持谦虚的态度，我们一同成长！
mysql的数据存在linux的哪个目录——数据目录（有图有真相）
CSDN-Ada助手: 恭喜作者撰写了关于“mysql的数据目录”的第15篇博客！持续创作真是不容易，您的努力与热情让读者们能够更加深入地了解mysql。希望您能继续分享关于数据库的知识，比如数据库备份与恢复、性能优化等方面的内容，这些对读者来说也是非常有价值的。谦虚地说，期待着您的下一篇博客！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。