SQL基础——MySQL的索引

ballball~~

已于 2024-08-23 11:48:14 修改

阅读量1.1k

点赞数 34

分类专栏： SQL_learn 文章标签： sql mysql 数据库

于 2024-08-15 11:15:26 首次发布

本文链接：https://blog.csdn.net/m0_66890670/article/details/141063839

版权

SQL_learn 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

简介：个人学习分享，如有错误，欢迎批评指正。

一、概述

介绍
索引是通过某种算法，构建出一个数据模型，用于快速找出在某个列中有一特定值的行，不使用索引，MySQL必须从第一条记录开始读完整个表，直到找出相关的行，表越大，查询数据所花费的时间就越多，如果表中查询的列有一个索引，MySQL能够快速到达一个位置去搜索数据文件，而不必查看所有数据，那么将会节省很大一部分时间。

索引类似一本书的目录，比如要查找’student’这个单词，可以先找到s开头的页然后向后查找，这个就类似索引。

在这里插入图片描述
索引的分类

索引是存储引擎用来快速查找记录的一种数据结构，按照实现的方式类分，主要有Hash索引和B+Tree索引
Hash索引
在这里插入图片描述
B+Tree索引

二、MySQL索引

按照功能划分，索引划为以下分类:

在这里插入图片描述

1.单列索引

单列索引：一个索引只包含单个列，但一个表中可以有多个单列索引;

1.1. 普通索引

普通索引：MySQL中基本索引类型，没有什么限制，允许在定义索引的列中插入重复值和空值，纯粹为了查询数据更快一点。

创建索引

create database mydb5;
use mydb5;

-- 方式1-创建表的时候直接指定
create  table student(
    sid int primary key,
    card_id varchar(20),
    name varchar(20),
    gender varchar(20),
    age int,
    birth date, 
    phone_num varchar(20),
    score double,
    index index_name(name) -- 给name列创建索引
);

-- 方式2-直接创建
-- create index indexname on tablename(columnname); 
create index index_gender on student(gender); 


-- 方式3-修改表结构(添加索引)
-- alter table tablename add index indexname(columnname)
alter table student add index index_age(age);

查看索引

-- 1、查看数据库所有索引 
-- select * from mysql.`innodb_index_stats` a where a.`database_name` = '数据库名’; 
select * from mysql.`innodb_index_stats` a where a.`database_name` = 'mydb5';


-- 2、查看表中所有索引 
-- select * from mysql.`innodb_index_stats` a where a.`database_name` = '数据库名' and a.table_name like '%表名%’; 
select * from mysql.`innodb_index_stats` a where a.`database_name` = 'mydb5' and a.table_name like '%student%';


-- 3、查看表中所有索引 
-- show index from table_name; 
show index from student;

删除索引

drop index index_gender on student 
-- 或
alter table student drop index index_name

1.2. 唯一索引

介绍
唯一索引与前面的普通索引类似，不同的就是：索引列的值必须唯一，但允许有空值。如果是组合索引，则列值的组合必须唯一。它有以下几种创建方式：

创建索引

-- 方式1-创建表的时候直接指定
create  table student2(
    sid int primary key,
    card_id varchar(20),
    name varchar(20),
    gender varchar(20),
    age int,
    birth date, 
    phone_num varchar(20),
    score double,
    unique index_card_id(card_id) -- 给card_id列创建索引
);
-- 方式2-直接创建
-- create unique index 索引名 on 表名(列名) 
create unique index index_card_id on student2(card_id);

-- 方式3-修改表结构(添加索引)
-- alter table 表名 add unique [索引名] (列名)
alter table student2 add unique index_phone_num(phone_num)

删除索引

drop index index_card_id on student2 
-- 或 
alter table student2 drop index index_phone_num

1.3. 主键索引

介绍
每张表一般都会有自己的主键，当我们在创建表时，MySQL会自动在主键列上建立一个索引，这就是主键索引。主键是具有唯一性并且不允许为NULL，所以他是一种特殊的唯一索引。

2.组合索引

介绍
组合索引也叫复合索引，指的是我们在建立索引的时候使用多个字段，例如同时使用身份证和手机号建立索引，同样的可以建立为普通索引或者是唯一索引。
复合索引的使用复合最左原则。

格式

– 创建索引的基本语法
create index indexname on table_name(column1(length),column2(length));

代码

-- 组合索引
use mydb5;
-- 创建索引的基本语法-- 普通索引
-- create index indexname on table_name(column1(length),column2(length)); 
create index index_phone_name on student(phone_num,name);
-- 操作-删除索引
 drop index index_phone_name on student; 
-- 创建索引的基本语法-- 唯一索引
create  unique index index_phone_name on student(phone_num,name);


select * from student where name = '张三'; 
select * from student where phone_num = '15100046637'; 
select * from student where phone_num = '15100046637' and name = '张三'; 
select * from student where name = '张三' and phone_num = '15100046637'; 
/* 
  三条sql只有 2 、 3、4能使用的到索引idx_phone_name,因为条件里面必须包含索引前面的字段  才能够进行匹配。
  而3和4相比where条件的顺序不一样，为什么4可以用到索引呢？是因为mysql本身就有一层sql优化，他会根据sql来识别出来该用哪个索引，我们可以理解为3和4在mysql眼中是等价的。 

*/

3.全文索引

概述
全文索引的关键字是fulltext

全文索引主要用来查找文本中的关键字，而不是直接与索引中的值相比较，它更像是一个搜索引擎，基于相似度的查询，而不是简单的where语句的参数匹配。

用 like + % 就可以实现模糊匹配了，为什么还要全文索引？like + % 在文本比较少时是合适的，但是对于大量的文本数据检索，是不可想象的。全文索引在大量的数据面前，能比 like + % 快 N 倍，速度不是一个数量级，但是全文索引可能存在精度问题。

只有字段的数据类型为 char、varchar、text 及其系列才可以建全文索引；

在数据量较大时候，现将数据放入一个没有全文索引的表中，然后再用create index创建fulltext索引，要比先为一张表建立fulltext然后再将数据写入的速度快很多；
MySQL 中的全文索引，有两个变量，最小搜索长度和最大搜索长度，对于长度小于最小搜索长度和大于最大搜索长度的词语，都不会被索引。通俗点就是说，想对一个词语使用全文索引搜索，那么这个词语的长度必须在以上两个变量的区间内。这两个的默认值可以使用以下命令查看:

show variables like ‘%ft%’;

在这里插入图片描述

参数解释:

在这里插入图片描述

代码

-- 创建表的时候添加全文索引
create table t_article (
     id int primary key auto_increment ,
     title varchar(255) ,
     content varchar(1000) ,
     writing_date date -- , 
     -- fulltext (content) -- 创建全文检索
);

insert into t_article values(null,"Yesterday Once More","When I was young I listen to the radio",'2021-10-01');
insert into t_article values(null,"Right Here Waiting","Oceans apart, day after day,and I slowly go insane",'2021-10-02'); 
insert into t_article values(null,"My Heart Will Go On","every night in my dreams,i see you, i feel you",'2021-10-03');
insert into t_article values(null,"Everything I Do","eLook into my eyes,You will see what you mean to me",'2021-10-04');
insert into t_article values(null,"Called To Say I Love You","say love you no new year's day, to celebrate",'2021-10-05');
insert into t_article values(null,"Nothing's Gonna Change My Love For You","if i had to live my life without you near me",'2021-10-06');
insert into t_article values(null,"Everybody","We're gonna bring the flavor show U how.",'2021-10-07');


-- 修改表结构添加全文索引
alter table t_article add fulltext index_content(content)
 
-- 直接添加全文索引
create fulltext index index_content on t_article(content);

使用索引

使用全文索引和常用的模糊匹配使用 like + % 不同，全文索引有自己的语法格式，使用 match 和 against 关键字，格式:

match (col1,col2,…) against(expr [search_modifier])

select * from t_article where match(content) against('yo'); -- 没有结果 单词数需要大于等于3 
select * from t_article where match(content) against('you'); -- 有结果
select * from t_article where content like '%you%';

4.空间索引

空间索引是对空间数据类型的字段建立的索引，MYSQL中的空间数据类型有4种，分别是GEOMETRY、POINT、LINESTRING、POLYGON。
MYSQL使用SPATIAL关键字进行扩展，使得能够用于创建正规索引类型的语法创建空间索引。
创建空间索引的列，必须将其声明为NOT NULL。
在这里插入图片描述

代码


create table shop_info (
  id  int  primary key auto_increment comment 'id',
  shop_name varchar(64) not null comment '门店名称',
  geom_point geometry not null comment '经纬度',
  spatial key geom_index(geom_point)
);

索引的验证

-- 创建临时表
create  temporary  table tmp_goods_cat
as
select t3.catid   as cat_id_l3,   -- 3级分类id
       t3.catname as cat_name_l3, -- 3级分类名称
       t2.catid   as cat_id_l2,   -- 2级分类id
       t2.catname as cat_name_l2, -- 2级分类名称
       t1.catid   as cat_id_l1,   -- 1级分类id
       t1.catname as cat_name_l1  -- 1级分类名称
from itcast_shop.itheima_goods_cats t3,
     itcast_shop.itheima_goods_cats t2,
     itcast_shop.itheima_goods_cats t1
where t3.parentid = t2.catid
  and t2.parentid = t1.catid
  and t3.cat_level = 3;

 
 -- -- 统计分析不同一级商品分类对应的总金额、总笔数
select
  '2019-09-05',
  t1.cat_name_l1 as goods_cat_l1,
  sum(t3.payprice * t3.goodsnum) as total_money,
  count(distinct t3.orderid) as total_cnt
from
  tmp_goods_cat t1
left join itheima_goods t2
  on t1.cat_id_l3 = t2.goodscatid
left join itheima_order_goods t3
  on t2.goodsid = t3.goodsid
where
  substring(t3.createtime, 1, 10) = '2019-09-05'
group by
  t1.cat_name_l1;

-- 创建索引
create unique index idx_goods_cat3 on tmp_goods_cat(cat_id_l3);
create unique index idx_itheima_goods on itheima_goods(goodsid);    
create index idx_itheima__order_goods on itheima_order_goods(goodsid);

在这里插入图片描述

可以看到添加索引之后，查询速度明显提高了很多。

5. 单列索引和组合索引对比

单列索引的优缺点
优点：

创建和维护成本较低：单列索引只需要处理一列的数据，因而相对简单，维护成本较低。
查询优化简单：对于单列的条件查询，例如WHERE column_name = value，可以直接利用该索引加速查询。
适用于特定查询：在需要频繁根据某一列进行查询或排序时，单列索引能够提供较大的性能提升。

缺点：

无法优化多列查询：当查询条件涉及多个列时，单列索引的优化效果有限。例如，查询条件WHERE column1 = value1 AND column2 = value2时，单列索引只能优化其中的一列，无法同时优化多个列。
占用更多存储空间：如果需要在多列上分别创建索引，会占用更多的存储空间，增加数据库的存储开销。

组合索引的优缺点
优点：

优化多列查询：组合索引可以优化涉及多个列的查询，例如WHERE column1 = value1 AND column2 = value2，可以显著提高查询速度。
减少索引数量：通过组合索引，可以避免为每一列单独创建索引，从而减少索引的数量和维护开销。
覆盖索引：在某些情况下，组合索引可以成为“覆盖索引”，即查询所需的所有数据都可以通过索引直接获取，从而避免访问表的数据。

缺点：

维护成本较高：组合索引涉及多列数据，因此在插入、更新和删除操作时，组合索引的维护成本较高，可能会影响写操作的性能。
选择性受限：组合索引的利用是有顺序的，通常只能对最左前缀列的查询进行优化。例如，假设有组合索引(column1, column2)，只有WHERE column1 = value1或WHERE column1 = value1 AND column2
= value2的查询才能有效利用该索引；如果只查询column2，则无法利用这个组合索引。
占用更多存储空间：虽然组合索引减少了索引数量，但由于组合索引同时包含多个列的数据，因此在某些情况下它可能占用较多的存储空间。

单列索引和组合索引对比总结

单列索引：适用于对单列进行频繁查询的场景，维护成本低，但无法优化多列查询。
组合索引：适用于对多列进行联合查询的场景，能够显著提升查询性能，但维护成本较高，且在使用上有顺序限制。

在实际应用中，选择单列索引还是组合索引需要根据查询场景、数据特点以及性能需求进行权衡。如果一个表中的查询经常涉及多列联合查询，组合索引可能会更合适；如果查询主要集中在单个列上，单列索引则是更好的选择。

三、索引的原理

一般来说，索引本身也很大，不可能全部存储在内存中，因此索引往往以索引文件的形式存储的磁盘上。
这样的话，索引查找过程中就要产生磁盘I/O消耗，相对于内存存取，I/O存取的消耗要高几个数量级，所以评价一个数据结构作为索引的优劣最重要的指标就是在查找过程中磁盘I/O操作次数的渐进复杂度。
换句话说，索引的结构组织要尽量减少查找过程中磁盘I/O的存取次数。

1.Hash算法
在这里插入图片描述
优点：通过字段的值计算的hash值，定位数据非常快。
缺点：不能进行范围查找，因为散列表中的值是无序的，无法进行大小的比较。