mysql索引及原理

最新推荐文章于 2022-05-28 20:24:49 发布

freedomfanye

最新推荐文章于 2022-05-28 20:24:49 发布

阅读量196

点赞数

分类专栏： MySQL 文章标签： mysql

本文链接：https://blog.csdn.net/freedomfanye/article/details/79542444

版权

MySQL 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Mysql有哪些索引？

从数据结构角度看：

1.B+树索引（O（logn））

2.hash索引：

——仅仅能满足“=”“IN”“<=>”查询，不能使用范围查询。

——其检索效率非常高，索引的检索可以一次定位，不像B-Tree索引需要从根节点到叶子节点，最后才能访问到叶子节点这样多次的IO访问，所以Hash索引的查询效率要远高于B-Tree。

——只有Memory存储引擎显示支持Hash索引。

3.FullText索引（目前MyIsam和InnoDB引擎都支持了）

4.R-Tree索引（用于GIS数据类型创建Spatial索引）

从物理角度看：

1.聚集索引（clustered index）

2.非聚集索引（non-clustered index）

从逻辑角度看：

1.主键索引：主键索引是一种特殊的唯一索引，不允许有空值

2.普通索引或者单列索引

3.多列索引（复合索引）：复合索引指多个字段上创建的索引，只有在查询条件中使用了创建索引时的第一个字段，索引才会被使用，使用复合索引时遵循最左前缀集合

4.唯一索引或者非唯一索引

5.空间索引：空间索引是对空间数据类型的字段建立的索引，Mysql中的空间数据类型有4种，分别是Geometry、Point、LineString、PolyGon。Mysql使用SPatial关键字进行扩展，使得能够用于创建正规索引类型的语法创建空间索引。创建空间索引的列，必须将其声明为NOT NULL，空间索引只能在储存引擎为MyIsam的表中创建。

CREATE TABLE table_name[col_name data type]
[unique|fulltext|spatial][index|key][index_name](col_name[length])[asc|desc]

——unique|fulltext|spatial为可选参数，分别表示唯一索引、全文索引和空间索引；

——index和key为同义词，两者作用相同，用来指定创建索引

——col_name为需要创建索引的字段列，该列必须从数据表中该定义的多个列中选择；

——index_name指定索引的名称，为可选参数，如果不指定，MYSQL默认col_name为索引值；

——length为可选参数，表示索引的长度，只有字符串类型的字段才能指定索引长度；

——asc或desc指定升序或降序的索引值存储

索引原理？

想要理解索引原理必须清楚一种数据结构（平衡树），也就是B tree或者B+ Tree，当然有的数据库也使用哈希桶作为索引的数据结构，然后主流的rdbms都是把平衡树当作数据表默认的索引数据结构的。

聚集索引：

我们平时建表的时候都会为表加上主键，在某些关系数据库中，如果建表时不指定主键，数据库会拒绝建表的语句执行，事实上，一个加上了主键的表，并不能成为为表。一个没加主键的表，他的数据无序的放置在磁盘存储器上，一行一行的排列的很整齐，跟人们认知中的表很接近。如果给表加上了主键，那么表在磁盘上的存储结构就由整齐排列的结构转变成了树状结构，也就是上面所说的平衡树结构，换句话说，就是整个表就变成了一个索引，也就是所谓的聚集索引。这就是为什么一个表只能有一个主键，一个表只能有一个聚集索引，因为主键的作用就是把表的数据格式转换成了索引（平衡树）的格式放置。

其中树的所有节点（底部除外）的数据都是由主键字段中的数据构成，也就是通常我们指定主键的id字段。最下面部分是真正表中的数据。假如一张表有一亿条数据，需要查找其中某一条数据，按照常规逻辑，一条一条的去匹配的话，最坏的情况下需要匹配一亿次才能得到结果，最坏时间复杂度O（n），这是无法接受的，而且这一亿条数据显然不能一次性的读入内存供程序使用。如果把这张表转换成平衡树结构，假设这棵树有20层，那么只需要20次IO开销就能查找到所需要的数据，速度以指数级别提升，时间复杂度O（logn）。

非聚集索引：

非聚集索引和聚集索引一样，同样是采用平衡树作为索引的数据结构。索引树结构中各个节点的值来自于表中的索引字段，假如给user表的name字段加上索引，那么索引就是由name字段中的值构成，在数据改变时，dbms需要一直维护索引结构的正确性。如果给表中多个字段加上索引，那么就会出现多个独立的索引结构，每个索引（非聚集索引）互相之间不存在关联。

每次给字段建一个新索引，字段中的数据就会被复制一份出来，用于生成索引。因此，给表添加索引，会增加表的体积，占用磁盘存储空间。

非聚集索引和聚集索引的区别：

通过聚集索引可以查到需要查找的数据，而通过非聚集索引可以查到记录对应的主键值，在使用主键的值通过聚集索引查找到需要的数据。

不管以任何方式查询表，最终都会利用主键通过聚集索引来定位到数据，聚集索引（主键）是通往真实数据所在的唯一路径。

然而，有一种例外可以不使用聚集索引就能查询出所需要的数据，这种方法称之为“覆盖索引”查询，也就是平时所说的复合索引或者多字段索引查询。

例如：

create index index_age on user_info(age); //建立索引

select user_name from user_info where age=`20` //查询年龄是20的用户的用户名

这句的sql语句执行过程：

首先，通过非聚集索引index_age查找age等于20的所有记录的主键ID值；然后通过得到的主键ID值执行聚集索引查找，找到主键ID值对就是真实数据存储的位置；最后，从得到的真实数据中取得user_name字段的值返回，也就是取得最终的结构。

我们将age字段上的索引改成双字段的覆盖索引

create index index_age_and_user_name on user_info(age,user_name);

这条sql语句的执行过程就会变为：

通过非聚集索引index_age_and_user_name查找age等于20的叶节点的内容，然而，叶节点中除了有user_name表主键ID的值以外，user_name字段的值也在里面，因此不需要通过主键ID值的查找数据行的真实所在，直接取得叶节点中user_name的值返回即可。

freedomfanye

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
mysql索引及原理

Mysql有哪些索引？从数据结构角度看：1.B+树索引（O（logn））2.hash索引：——仅仅能满足“=”“IN”“&lt;=&gt;”查询，不能使用范围查询。——其检索效率非常高，索引的检索可以一次定位，不像B-Tree索引需要从根节点到叶子节点，最后才能访问到叶子节点这样多次的IO访问，所以Hash索引的查询效率要远高于B-Tree。——只有Memory存储引擎显示支持Hash索引。3.F...
复制链接

扫一扫

专栏目录