MySql--索引

最新推荐文章于 2024-03-18 16:16:48 发布

ONROAD0612

最新推荐文章于 2024-03-18 16:16:48 发布

阅读量264

点赞数

分类专栏： MySql

本文链接：https://blog.csdn.net/ONROAD0612/article/details/81093131

版权

MySql 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1简介

官方定义：索引（Index）是帮助 MySQL 高效获取数据的数据结构。
大家一定很好奇，索引为什么是一种数据结构，它又是怎么提高查询的速度？我们拿最常用的二叉树来分析索引的工作原理。看下面的图片：

2创建索引的优势

提高数据的检索速度，降低数据库 IO 成本：使用索引的意义就是通过缩小表中需要查询的记录的数目从而加快搜索的速度。
降低数据排序的成本，降低 CPU 消耗：索引之所以查的快，是因为先将数据排好序，若该字段正好需要排序，则真好降低了排序的成本。

3创建索引的劣势

占用存储空间：索引实际上也是一张表，记录了主键与索引字段，一般以索引文件的形式存储在磁盘上。
降低更新表的速度：表的数据发生了变化，对应的索引也需要一起变更，从而减低的更新速度。否则索引指向的物理数据可能不对，这也是索引失效的原因之一。
优质索引创建难：索引的创建并非一日之功，也并非一直不变。需要频繁根据用户的行为和具体的业务逻辑去创建最佳的索引。

4索引分类

我们常说的索引一般指的是 BTree（多路搜索树）结构组织的索引。其中还有聚合索引，次要索引，复合索引，前缀索引，唯一索引，统称索引，当然除了 B + 树外，还有哈希索引（hash index）等。

单值索引：一个索引只包含单个列，一个表可以有多个单列索引
唯一索引：索引列的值必须唯一，但允许有空值
复合索引：一个索引包含多个列，实际开发中推荐使用

实际开发中推荐使用复合索引，并且单表创建的索引个数建议不要超过五个

基本语法如下：

（1）创建

create [unique] index indexName on tableName (columnName...)
alter tableName add [unique] index [indexName] on (columnName...)

（2）删除

drop index [indexName] on tableName

（3）查看

show index from tableName

那么哪些情况需要创建索引呢？

主键，唯一索引。
经常用作查询条件的字段需要创建索引。
经常需要排序、分组和统计的字段需要建立索引。
查询中与其他表关联的字段，外键关系建立索引。

哪些情况不需要创建索引？

表的记录太少，百万级以下的数据不需要创建索引。
经常增删改的表不需要创建索引。
数据重复且分布平均的字段不需要创建索引，如 true,false 之类。
频发更新的字段不适合创建索引。
where 条件里用不到的字段不需要创建索引。

5性能分析

（1）MySql自身瓶颈

MySQL 自身参见的性能问题有磁盘空间不足，磁盘 I/O 太大，服务器硬件性能低。

CPU：CPU 在饱和的时候一般发生在数据装入内存或从磁盘上读取数据时候
IO：磁盘 I/O 瓶颈发生在装入数据远大于内存容量的时候
服务器硬件的性能瓶颈：top,free,iostat 和 vmstat 来查看系统的性能状态

（2）explain分析sql语句

使用 explain 关键字可以模拟优化器执行 sql 查询语句，从而得知 MySQL 是如何处理 sql 语句。

+----+-------------+-------+------------+------+---------------+-----+---------+------+------+----------+-------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref  | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------+-----+---------+------+------+----------+-------+

select 查询的序列号，包含一组可以重复的数字，表示查询中执行 sql 语句的顺序。一般有三种情况：
第一种：id 全部相同，sql 的执行顺序是由上至下；
第二种：id 全部不同，sql 的执行顺序是根据 id 大的优先执行；
第三种：id 既存在相同，又存在不同的。先根据 id 大的优先执行，再根据相同 id 从上至下的执行。

select_type

select 查询的类型，主要是用于区别普通查询，联合查询，嵌套的复杂查询
simple：简单的 select 查询，查询中不包含子查询或者 union
primary：查询中若包含任何复杂的子查询，最外层查询则被标记为 primary
subquery：在 select 或 where 列表中包含了子查询
derived：在 from 列表中包含的子查询被标记为 derived（衍生）MySQL 会递归执行这些子查询，把结果放在临时表里。
union：若第二个 select 出现在 union 之后，则被标记为 union，若 union 包含在 from 子句的子查询中，外层 select 将被标记为：derived
union result：从 union 表获取结果的 select

partitions

表所使用的分区，如果要统计十年公司订单的金额，可以把数据分为十个区，每一年代表一个区。这样可以大大的提高查询效率。

type

这是一个非常重要的参数，连接类型，常见的有：all , index , range , ref , eq_ref , const , system , null 八个级别。性能从最优到最差的排序：system > const > eq_ref > ref > range > index > all。

对 java 程序员来说，若保证查询至少达到 range 级别或者最好能达到 ref 则算是一个优秀而又负责的程序员。

all：（full table scan）全表扫描无疑是最差，若是百万千万级数据量，全表扫描会非常慢。

index：（full index scan）全索引文件扫描比 all 好很多，毕竟从索引树中找数据，比从全表中找数据要快。

range：只检索给定范围的行，使用索引来匹配行。范围缩小了，当然比全表扫描和全索引文件扫描要快。sql 语句中一般会有 between，in，>，< 等查询。

ref：非唯一性索引扫描，本质上也是一种索引访问，返回所有匹配某个单独值的行。比如查询公司所有属于研发团队的同事，匹配的结果是多个并非唯一值。

eq_ref：唯一性索引扫描，对于每个索引键，表中有一条记录与之匹配。比如查询公司的 CEO，匹配的结果只可能是一条记录，

const：表示通过索引一次就可以找到，const 用于比较 primary key 或者 unique 索引。因为只匹配一行数据，所以很快，若将主键至于 where 列表中，MySQL 就能将该查询转换为一个常量。

system：表只有一条记录（等于系统表），这是 const 类型的特列，平时不会出现，了解即可

possible_keys

显示查询语句可能用到的索引 (一个或多个或为 null)，不一定被查询实际使用。仅供参考使用。

key

显示查询语句实际使用的索引。若为 null，则表示没有使用索引。