浅谈mysql索引的理解

最新推荐文章于 2022-08-27 21:20:20 发布

thorraythorray

最新推荐文章于 2022-08-27 21:20:20 发布

阅读量118

点赞数

分类专栏：索引数据库 btree 文章标签： mysql 数据库索引

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nibuyaoshiwang/article/details/109588028

版权

索引同时被 3 个专栏收录

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

db的知识真的是又深又广，本着务实的态度，只简单谈谈我对数据库的索引一些方面的理解。说道索引，要简单说说索引的结构也就是b-tree的一些知识。

b+tree和btree是innodb磁盘等外存贮时查找的一种结构，因为磁盘读写涉及到大量的io，为了需要加快读写速度避免大量io操作，因此设计了一种平衡二叉树，平衡的意思就是树的每个分支的高度差保证在1之内，这样可以减小查找复杂度。

btree有下面有几个特征:

每个节点都有一个key,data。key就是索主键，data就是数据。
如果不是终端节点，每个节点有n个分支。
所有的终端节点都是在同一层。
终端节点没有指针，其余节点是有指针的指向它的下一层数据范围。

b+tree是在btree上的一种优化，它和btree的区别有下面两点。

所有的终端节点才存有数据，其他节点只放指针和key。
所有的终端节点用链表链接。

这样同样的页大小，间接放置的索引值增多，索引量加大，一次性读入内存的关键词加多，相对的io读写次数下降，效率就会提升。另外，终端链表可以快速查找范围数据也加快了查询。

主键

主键是唯一索引的一种，并且不能有null的记录存在，但唯一索引并不一定是主键，唯一索引可以很多，并且允许为null。一般都手动设置id为主键。如果我们不设置主键，sql会从唯一主键中挑出一个没有null的字段作为主键；如果这也不满足，它会自己产生以行号变化的字段作为主键，这个主键的内容我们可以用_rowid来查。

聚集索引

当主键产生后，会根据主键生成这张表的唯一一种聚合索引，它的叶子结点存的是真实数据的物理地址。id一般作为聚合索引，也会有使用时间作为聚合索引也是不错的实践选择。自增型还是比较友好的。

非聚集索引

联合索引和普通索引，可以有多个。联合索引使用多个字段联合查询，遵循最左侧原理，使用频繁的字段靠左，可以提高速度。例如abc联合索引的本质就是分别创建a ab abc的索引，普通索引就是分别建立a b c的索引。当查a and b时，联合就比较快，而查b and c或者a or b时普通就比较快。

回表查询

因为只有主键的索引树才会把数据的真实地址放在叶子结点上，而一般索引树的叶子结点放的只是主键值，需要通过本索引key先查到主键的key，然后再按主键查到数据。这整个过程叫“回表”。
在这里插入图片描述

索引覆盖

当普通索引查询一次即可获得结果，不用回表再查。

select id,name,sex ... where name='shenjian';

将name和sex建立联合索引，就可以直接取一次拿到数据，如果只有name活着sex一个单索引，是需要通过id再查一次的。

非聚集索引和聚集索引的区别在于：

聚集索引的叶子结点上的数据是真实数据的物理地址，非聚集索引的b+tree的叶子结点上的数据是主键值。
不管以任何方式查询表，最终都会利用主键通过聚集索引来定位到数据，聚集索引（主键）是通往真实数据所在的唯一路径。而通过非聚集索引可以查到记录对应的主键值，再使用主键的值通过聚集索引查找到需要的数据。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
浅谈mysql索引的理解

数据库的知识又深又广，本着务实的态度，只简单谈谈我对数据库的索引btree的理解。b+tree和btree是innodb磁盘等外存贮时查找的一种结构，因为磁盘读写涉及到大量的io，为了需要加快读写速度避免大量io操作，因此设计了一种平衡二叉树，平衡的意思就是树的每个分支的高度差保证在1之内，这样可以减小查找复杂度。btree有下面有几个特征:每个节点都有一个key,data。key就是索主键，data就是数据。如果不是终端节点，每个节点有n个分支。所有的终端节点都是在同一层。终端节点没有指针，
复制链接

扫一扫

专栏目录

thorraythorray CSDN认证博客专家 CSDN认证企业博客

码龄9年

47: 原创

16万+: 周排名

76万+: 总排名

3万+: 访问

: 等级

487: 积分

2: 粉丝

6: 获赞

10: 评论

35: 收藏

私信

关注

热门文章

分类专栏

最新评论

python subprocess模块非阻塞交互
grant-bobo: 还有DN
python subprocess模块非阻塞交互
m0_74831600: 还有outtime
python subprocess模块非阻塞交互
m0_74831600: t_begin没定义吧?
python celery的task-based-class写法
北风之神c: 写得赞，博主用心了，但主要还是celery太难了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字，所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图， 1) 整个项目目录结构,celery的目录结构和任务函数位置，有很大影响 2) @task入参 ,用户有没有主动设置装饰器的入参 name,设置了和没设置有很大不同，建议主动设置这个名字对函数名字和所处位置依赖减小 3) celery的配置，task_queues(在3.xx叫 CELERY_QUEUES )和task_routes (在3.xx叫 task_routes) 4) celery的配置 include （在3.xx叫 CELERY_INCLUDE）或者 imports (3.xx CELERY_IMPORTS) 或者 app.autodiscover_tasks的入参 5) cmd命令行启动参数 --queues= 的值 6) 用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 此国产分布式函数调度框架 https://function-scheduling-distributed-framework.readthedocs.io/zh_CN/latest/index.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等19个方面全方位超过celery，任何方面都是有过之而无不及。
elasticsearch聚合过滤操作
大家一起学编程（python）: 强到离谱

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。