一、索引的概念
1.1 索引是什么
MySQL官方对索引的定义:索引(Index)是帮助MySQL搞笑获取数据的数据结构。索引的本质是数据结构,可以简单理解为排好序的快速查找数据结构。
在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构一某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法。这种数据结构,就是索引。下图就是一种可能的索引方式实例:
左边是数据表,一共有两列七条记录,最左边的是数据记录的物理地址。为了加快Col2的查找,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找在一定的复杂度内获取到相应数据,从而快速的检索出符合条件的记录。
一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件形式存储在磁盘上。
1.2 优缺点
优势:
- 提高数据检索的效率,降低数据库的IO成本
- 通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗。
劣势:
- 虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行insert、update和delete。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引的字段,都会调整因为更新所带来的的键值变化后的索引信息。
- 实际上索引也是一张表,该表保存了主键和索引字段,并指向实体表的记录,所以索引也是要占用空间的。
二、MySQL的索引
2.1 Btree索引
MySQL使用的是Btree索引。
【初始化介绍】
一颗B树,浅蓝色的块称之为磁盘块,可以看到每个磁盘块包含几个数据项(深蓝色所示)和指针(黄色所示),如磁盘块1包含数据项17和35,包含指针P1、P2、P3,P1表示小于17的磁盘块,P2表示在17和35之间的磁盘块,P3表示大于35的磁盘块。真实的数据存在于叶子节点3、5、9、10、13、15、28、29、36、60、75、79、90、99。非叶子节点不存储真实的数据,只存储指引搜索方向的数据项,如17、35并不真实存在于数据表中。
【查找过程】
如果要查找数据项29,那么首先会把磁盘块1由磁盘加载到内存,此时发生一次IO,在内存中用二分查找确定29在17和35之间,锁定磁盘块1的P2指针,内存时间因为非常短(相比磁盘IO)可以忽略不计,通过磁盘块1的P2指针的磁盘地址吧磁盘块3由磁盘加载到内存,发生第二次IO,29在26和30之间,锁定磁盘块3的P2指针,通过指针加载磁盘块8到内存,发生第三次IO,同时内存中做二分查找找到29,结束查询,总计三次IO。
真实的情况是,3层的B+树可以表示上百万的数据,如果上百万的数据查找只需要三次IO,性能提高将是巨大的,如果没有索引,每个数据项都要发生一次IO,那么总共需要百万次的IO,显然成本非常非常高。
聚簇索引的好处:
按照聚簇索引排列顺序,查询显示一定范围数据的时候,由于数据都是紧密相连,数据库不用从多个数据块中提取数据,所以节省了大量的IO操作。
聚簇索引的限制:
对于mysql数据库目前只有innodb数据引擎支持聚簇索引,二Myisam并不支持聚簇索引。
由于数据物理存储排序方式只能有一种,所以每个Mysql的表只能有一个聚簇索引。一般情况下就是该表的主键。
为了充分利用聚簇索引的聚簇的特性,索引innodb表的主键列尽量选用有序的顺序id,而不建议用无序的id,比如uuid这种。
三、MySQL索引分类
3.1 单值索引
概念:寄一个索引只包含单个列,一个表可以有多个单列索引。
语法:创建索引命名的规则index_表名_字段名
--索引和表一起创建
CREATE TABLE customer (id INT(10) UNSIGNED AUTO_INCREMENT ,customer_no VARCHAR(200),customer_name VARCHAR(200),
PRIMARY KEY(id),
KEY (customer_name)
);
--单独创建索引
CREATE INDEX idx_customer_name ON customer(customer_name);
3.2 唯一索引
概念:索引列的值必须唯一,但允许有空值
索引随表一起创建:
CREATE TABLE customer (id INT(10) UNSIGNED AUTO_INCREMENT ,customer_no VARCHAR(200),customer_name VARCHAR(200),
PRIMARY KEY(id),
KEY (customer_name),
UNIQUE(customer_no)
);
--单独创建唯一索引
create unique index idx_customer_no on customer(customer_no);
3.3 主键索引
概念:设定为主键后数据库会自动建立索引,innodb为聚簇索引
--随表一起建索引
CREATE TABLE customer (id INT(10) UNSIGNED AUTO_INCREMENT ,customer_no VARCHAR(200),customer_name VARCHAR(200),
PRIMARY KEY(id)
);
--单独建主键索引
alter table customer add primary kry customer(customer_no);
--删除主键索引
alter table customer drop primary key;
--修改主键索引
必须先删除掉(drop)原索引,再新建(add)索引
3.4 复合索引
概念:即一个索引包含多个列
--随表一起建索引
CREATE TABLE customer (id INT(10) UNSIGNED AUTO_INCREMENT ,customer_no VARCHAR(200),customer_name VARCHAR(200),
PRIMARY KEY(id),
KEY (customer_name),
KEY(customer_no,customer_name)
);
--单独建索引
create index idx_no_name on customer(customer_no,customer_name);
3.5 基本语法
操作 | 命令 |
创建 | create [unique] index [indexName] on table_name(column) |
删除 | drop index [indexName] on table_name; |
查看 | show index from table_name; |
使用Alter命令 | alter table tbl_name add primary key (column_list);该语句添加一个主键,这意味着索引值必须是唯一的,切不能为NULL。 |
alter table tbl_name add primary key (column_list) | |
alter table tbl_name add index index_name(column_list);添加普通索引,索引值可出现多次。 | |
alter table tbl_name add fulltext index_name(column_list);该语句指定了索引为FULLTEXT,用于全文索引。 |
4. 索引的创建时机
4.1 表的主关键字:主键自动建立唯一索引;
如customer表的id
4.2 表的字段唯一约束
4.3 频繁作为查询条件的字段应该创建索引
索引的目的就是提升查询速度,所以对于查询频率高的字段要创建索引,如:用户表的手机号。
4.4 查询中与其他表关联的字段,外键关系建立索引
4.5 索引的数目不以太多
每创建一个索引都会占用相应的物理控件;
过多的索引会导致insert、update、delete语句的执行效率降低;
4.6 若在实际中,需要将多个列设置索引时,可以采用多列索引
如:某个表(假设表名为Student),存在多个字段(no,name,sex,address,phone,birthdate),其中需要对no,name字段进行查询,对sex字段进行分组,对birthdate字段进行排序,此时可以创建多列索引
index index_student_no_name_sex_birth(no,name,sex,birthdate);
在上面的语句中只创建了一个索引,但是对4个字段都赋予了索引的功能。创建多列索引,需要遵循BTree类型,即第一列使用时,才启用索引。在上面的创建语句中,只有mysql语句在使用到no字段时,索引才会被启用,如:
select * from stident where no=1000; #使用到了no字段,索引被启用
4.7 查询中排序的字段,排序字段若通过索引去访问将大大提高排序的速度
4.8 查询中统计或分组字段应该建立索引
5. 不适合建立索引的情况
5.1 表记录太少
5.2 经常增删改的表或字段
5.3 where条件里用不到的字段不创建索引
5.4 过滤性不好的字段不适合建立索引。