MySQL索引

MySQL索引

一:MySQL索引的理解

  • 索引是一个单独的,存在磁盘上的数据库结构,包含着对数据表列里所有记录的引用指针。
  • 使用索引可以快速找出在某个或多个列中有一特定值的行。
  • 所有MySQL列类型都可以被索引,对相关列使用索引是提高查询操作速度的最佳途径。

索引是存储引擎中实现的,Mysql中索引的存储类型有两种,一种是BTREE(b树)另一种是HASH(哈希)

MylSAM和InnoDB存储引擎支持BTREE索引,MEMORY/HEAP存储引擎可以支持HASH和BTREE索引。

索引的优点:

  • 通过创建唯一索引,可以保证数据库表中每一行数据的唯一性。
  • 可以大大加快数据的查询速度,这也是创建索引的主要原因。
  • 在实现数据的参考完整性方面,可以加速表和表之间的连接。
  • 在使用分组和排序子句进行数据查询时,也可以显著减少查询中分组和排序的时间 。

索引的缺点

  • 创建索引和维护索引要耗费时间,并且随着数据量的增加所耗费的时间也会增加。
  • 索引需要占磁盘空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果有大量的索引,索引文件可能比数据文件更快达到最大文件尺寸。
  • 当对表中的数据进行增加、删除和修改的时候,索引也要动态地维护,这样就降低了数据的维护速度。

二:索引类型

  • 普通索引:
    • 普通索引是MySQL中的基本索引类型,允许在定义索引的列中插入重复值和空值
  • 唯一索引:
    • 唯一索引要求索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。 主键索引是一种特殊的唯一索引,不允许有空值。
  • 单列索引:
    • 单列索引即一个索引只包含单个列,一个表可以有多个单列索引。
  • 组合索引:
    • 组合索引是指在表的多个字段组合上创建的索引,只有在查询条件中使用了这些字段的左边字段时,索引才会被使用。使用组合索引时遵循最左前缀集合
  • 全文索引:
    • 全文索引类型为FULLTEXT,在定义索引的列上支持值的全文查找,允许在这些索引列中插入重复 值和空值。全文索引可以在CHAR、VARCHAR或者TEXT类型的列上创建。MySQL中只有MyISAM 存储引擎支持全文索引
  • 空间索引:
    • 空间索引是对空间数据类型的字段建立的索引,MySQL中的空间数据类型有4种,分别是 GEOMETRY、POINT、LINESTRING和POLYGON。MySQL使用SPATIAL关键字进行扩展,使得能 够用创建正规索引类似的语法创建空间索引。
    • 创建空间索引的列,必须将其声明为NOT NULL,空间索引只能在存储引擎为MyISAM的表中创建

三:创建保存索引

  • 在单个或多个列上创建索引

  • 在建表的时候创建索引

    CREATE TABLE table_name [col_name data_type] [UNIQUE|FULLTEXT|SPATIAL] [INDEX|KEY] [index_name] (col_name [length]) [ASC|DESC]
    

    其中,UNIQUE、FULLTEXT和SPATIAL为可选参数,分别表示唯一索引、全文索引和空间索引;INDEX 与KEY为同义词,两者作用相同,用来指定创建索引。

    CREATE TABLE t1 ( 
        id INT NOT NULL, 
        name CHAR(30) NOT NULL, 
        UNIQUE INDEX UniqIdx(id)  #创建了名为UniqIdx的唯一索引在id这个列上
    );
    
  • 在已经存在的表上创建索引

    使用ALTER TABLE语句

    ALTER TABLE table_name ADD [UNIQUE|FULLTEXT|SPATIAL] [INDEX|KEY] [index_name] (col_name[length],...) [ASC|DESC]
    
    ALTER TABLE book ADD UNIQUE INDEX UniqidIdx (bookId); #在book表中列bookId添加一个唯一索引
    

    使用CREATE INDEX语句

    CREATE [UNIQUE|FULLTEXT|SPATIAL] INDEX index_name ON table_name (col_name [length],...) [ASC|DESC]
    
    CREATE UNIQUE INDEX UniqidIdx ON book (bookId);
    

四:如何判断要不要加索引?

  • 当唯一性是某种数据本身的特征时,指定唯一索引。使用唯一索引需能确保定义的列的数据完整 性,以提高查询速度。
  • 在频繁进行排序或分组(即进行group by或order by操作)的列上建立索引,如果待排序的列有 多个,可以在这些列上建立组合索引。

五:创建了索引,就一定会走索引么?

不一定。
比如,在使用组合索引的时候,如果没有遵从“最左前缀”的原则进行搜索,则索引是不起作用的。
举例,假设在id、name、age字段上已经成功建立了一个名为MultiIdx的组合索引。索引行中按id、
name、age的顺序存放,索引可以搜索id、(id,name)、(id, name, age)字段组合。如果列不构成
索引最左面的前缀,那么MySQL不能使用局部索引,如(age)或者(name,age)组合则不能使用该
索引查询。
  • 查看索引是否生效

    • 使用EXPLAIN语句查看索引是否正在使用

      EXPLAIN SELECT * FROM book WHERE year_publication=1990;
      

      EXPLAIN语句将为我们输出详细的SQL执行信息,其中:

      • possible_keys行给出了MySQL在搜索数据记录时可选用的各个索引。
      • key行是MySQL实际选用的索引。

      如果possible_keys行和key行都包含year_publication字段,则说明在查询时使用了该索引。

六:建立索引的原则

  • 避免对经常更新的表进行过多的索引,并且索引中的列要尽可能少。应该经常用于查询的字段创建索引,但要避免添加不必要的字段。
  • 数据量小的表最好不要使用索引,由于数据较少,查询花费的时间可能比遍历索引的时间还要短, 索引可能不会产生优化效果。
  • 在条件表达式中经常用到的不同值较多的列上建立索引,在不同值很少的列上不要建立索引。比如 在学生表的“性别”字段上只有“男”与“女”两个不同值,因此就无须建立索引,如果建立索引不但不会提高查询效率,反而会严重降低数据更新速度。
  • 当唯一性是某种数据本身的特征时,指定唯一索引。使用唯一索引需能确保定义的列的数据完整性,以提高查询速度。
  • 在频繁进行排序或分组(即进行group by或order by操作)的列上建立索引,如果待排序的列有多个,可以在这些列上建立组合索引。

七:避免索引场景失效

  • 使用组合索引时,需要遵循“最左前缀”原则
  • 不在索引列上做任何操作,例如计算函数类型转换,会导致索引失效而转向全表扫描
  • 尽量使用覆盖索引(之访问索引列的查询),减少 select * 覆盖索引能减少回表次数
  • MySQL在使用不等于(!=或者<>)的时候无法使用索引会导致全表扫描
  • LIKE以通配符开头(%abc)MySQL索引会失效变成全表扫描的操作
  • 字符串不加单引号会导致索引失效(可能发生了索引列的隐式转换)
  • 少用or,用它来连接时会索引失效

模糊查询中如何使用索引?

模糊查询是不支持使用索引的,但是我们可以加入冗余列(MySQL5.7之后加入了虚拟列,使用虚拟列更合适,思路相同),比如 mobile_reverse,内部存储为 mobile 的倒叙文本,如 mobile为17312345678,那么 mobile_reverse 存储 87654321371,为 mobile_reverse 列建立索引,查询中使用语句 mobile_reverse like reverse(’%5678’) 即可。

reverse 是 MySQL 中的反转函数,这条语句相当于 mobile_reverse like ‘8765%’ ,这种语句是可以使 用索引的。

八:MySQL索引为什么用B+树

  • B+树由B树和索引顺序访问方法演化而来,它是为磁盘或其他直接存取辅助设备设计的一种平衡查找树,在B+树中,所有记录节点都是按键值的大小顺序存放在同一层的叶子节点,各叶子节点通过指针进 行链接。
  • [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sZptfMKl-1643343792221)(MySQL索引.assets/1643342059983.png)]
  • B+树索引在数据库中的一个特点就是高扇出性,例如在InnoDB存储引擎中,每个页的大小为16KB。
  • 在 数据库中,B+树的高度一般都在2~4层,这意味着查找某一键值最多只需要2到4次IO操作,这还不错。因为现在一般的磁盘每秒至少可以做100次IO操作2~4次的IO操作意味着查询时间只需0.02~ 0.04秒

九:Hash索引与B树索引的区别

  • hash索引底层就是hash表,进行查找时,调用一次hash函数就可以获取到相应的键值,之后进行回表查询获得实际数据。
  • B+树底层实现是多路平衡查找树,对于每一次的查询都是从根节点出发,查找到叶子节点方可以获得所查键值,然后根据查询判断是否需要回表查询数
  • 区别
    • hash索引进行等值查询更快(一般情况下),但是却无法进行范围查询。因为在hash索引中经过 hash函数建立索引之后,索引的顺序与原顺序无法保持一致,不能支持范围查询。
    • 而B+树的的所 有节点皆遵循(左节点小于父节点,右节点大于父节点,多叉树也类似),天然支持范围。
    • hash索引不支持使用索引进行排序,
    • hash索引不支持模糊查询以及多列索引的最左前缀匹配,原理也是因为hash函数的不可预测 。
    • hash索引任何时候都避免不了回表查询数据,而B+树在符合某些条件(聚簇索引,覆盖索引等)的 时候可以只通过索引完成查询。
    • hash索引虽然在等值查询上较快,但是不稳定,性能不可预测,当某个键值存在大量重复的时 候,发生hash碰撞,此时效率可能极差。而B+树的查询效率比较稳定,对于所有的查询都是从根 节点到叶子节点,且树的高度较低。
  • 因此,在大多数情况下,直接选择B+树索引可以获得稳定且较好的查询速度。而不需要使用hash索引。

十:聚簇索引和非聚簇索引有什么区别?

  • 在InnoDB存储引擎中,可以将B+树索引分为聚簇索引和辅助索引(非聚簇索引)。无论是何种索引, 每个页的大小都为16KB,且不能更改。
  • 聚簇索引是根据主键创建的一棵B+树,聚簇索引的叶子节点存放了表中的所有记录。
  • 辅助索引是根据索引键创建的一棵B+树,其叶子节点仅存放索引键值,以及该索引键值指向的主键。
  • 在InnoDB存储引擎中,可以将B+树索引分为聚簇索引和辅助索引(非聚簇索引)。无论是何种索引, 每个页的大小都为16KB,且不能更改。
  • 聚簇索引是根据主键创建的一棵B+树,聚簇索引的叶子节点存放了表中的所有记录。
  • 辅助索引是根据索引键创建的一棵B+树,其叶子节点仅存放索引键值,以及该索引键值指向的主键。
    • 也就是说,如果通过辅助索引来查找数据,那么当找到辅助索引的叶子节点后,很有可能还需要根 据主键值查找聚簇索引来得到数据,这种查找方式又被称为书签查找。因为辅助索引不包含行记录的所 有数据,这就意味着每页可以存放更多的键值,因此其高度一般都要小于聚簇索引。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值