目录
前言
索引是对数据库表中一列或多列的值进行排序的一种结构。MySQL索引的建立对于MySQL的高效运行是很重要的,索引可以大大提高MySQL的检索速度。索引只是提高效率的一个因素,如果你的MySQL有大数据量的表,就需要花时间研究建立最优秀的索引,或优化查询语句。
一、索引的概念
- 索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在的物理地址(类似于C语言的链表用过指针指向数据记录的内存地址)
- 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度
- 索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容
- 索引是表中一列或者若干列值排序的方法
- 建立索引的目的是加快对表中记录的查找或排序
小结:
- 索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址)。
- 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。
- 索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
- 索引是表中一列或者若干列值排序的方法。
- 建立索引的目的是加快对表中记录的查找或排序。
二、索引的作用和副作用
1.索引的作用
- 设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因
- 当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度
- 可以降低数据库地IO成本,并且索引还可以降低数据库地排序成本
- 通过创建唯一(键)性索引,可以保证数据表中地每一行数据的唯一性(约束/规则)
- 可以加快表与表之间的连接
- 在使用分组和排序时,可大大减少分组和排序的时间
提高查询速度、降低IO成本、加快表与表的连接减少分组排序时间
2.索引的副作用
- 索引需要占用额外的磁盘空间
对于MyISAM引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址
而InnoDB引擎的表数据文件本身就是索引文件 - 数据库在执行select这类的查询语句时,会先遍历索引表,如果无效、无用的索引,反而会增加数据库的查询时间消耗、资源消耗
- 在插入和修改数据时要"花费更多"的时间,因为索引也要随之变动
3.创建索引的原则依据
索引虽可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。
- 表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位。
- 记录数超过300行的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能。
- 经常与其他表进行连接的表,在连接字段上应该建立索引。
- 唯一性太差的字段(字段的重复率太高)不适合建立索引。
- 更新太频繁地字段不适合创建索引。因为在插入和修改数据时要花费更多的时间
- 经常出现在
where
子句中的字段,特别是大表的字段,应该建立索引。 - 在经常进行GROUP BY、ORDER BY的字段上建立索引;
- 索引应该建在选择性高的字段上。
- 索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引。
总结:
索引的主要作用:加快数据库数据查询速度,对某个字段或多个字段进行排序
索引是如何加快查询速度?
索引保存着索引的值以及这个值的数据所在行的物理地址,使用索引后可以不用再扫描/遍历全表来定位某行数据,而是先通过索引值找到相应行数据的物理地址后访问相应的数据。
拿索引做比喻,索引就像是书本的目录
副作用:索引文件会额外占用磁盘空间,修改或插入数据会花费更多时间
创建索引的原则:
表数据较多时,一般超过300行,就应该创建索引
一般是在主键、外键、经常出现在where,group by,order by或者多表查询时连接的字段上创建索引
索引一般不建议在:唯一性差的、会频繁更新的、大文本字段上创建
三、索引的分类和创建
以下操作都是基于此模板来进行操作
create database suoyin;
use suoyin;
create table member (id int(10),name varchar(10),cardid varchar(18),phone varchar(11),address varchar(50),remark text);
desc member;
insert into member values (1,'zhangsan','123','111111','nanjing','this is vip');
insert into member values (4,'lisi','1234','444444','nanjing','this is normal');
insert into member values (2,'wangwu','12345','222222','benjing','this is normal');
insert into member values (5,'zhaoliu','123456','555555','nanjing','this is vip');
insert into member values (3,'qianqi','1234567','333333','shanghai','this is vip');
insert into member values (6,'liuyi','123456','666666','nanjing','this is vip');
insert into member values (7,'laoba','1234567','888888','shanghai','this is vip');
select * from member;
create table member (id int(10),name varchar(10),cardid int(18),phone int(11),address varchar(50),remark text);
1、普通索引
- 最基本的索引类型,没有唯一性之类的限制。
(1)直接创建索引
CREATE INDEX 索引名 ON 表名 (列名[(length)]);
#(列名(length)):length是可选项,下同。如果忽略length的值,则使用整个列的值作为索引。如果指定,使用列的前length个字符来创建索引,这样有利于减小索引文件的大小。在不损失精确性的情况下,长度越短越好。
#索引名建议以"_index"结尾。
create index phone_index on member (phone); #将phone列创建为索引
desc member; #查看表结构
show create table member; #也可以查看索引是否创建成功
(2)修改表方式创建
ALTER TABLE 表名 ADD INDEX 索引名 (列名);
例:
alter table member add index id_index (id);
show create table member;
(3)创建表的时候指定索引(不建议)
CREATE TABLE 表名 ( 字段1 数据类型,字段2 数据类型[,...],INDEX 索引名(列名));
例:
create table test (id int(4) not null,name varchar(10) not null,cardid varchar(20) not null,index id_index (id));
show create table test;
2、唯一索引
- 与普通索引类似,但区别是唯一索引列的每个值都唯一。唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。
(1)直接创建唯一索引
CREATE UNIQUE INDEX 索引名 ON 表名(列名);
create unique index address_index on member (address);
#因为address每个值不具有唯一性,所以会创建失败
create unique index name_index on member (name);
#将name创建为唯一索引
show create table member; #检查是否创建索引
(2)修改表方式创建
ALTER TABLE 表名 ADD UNIQUE 索引名 (列名);
alter table member add unique cardid_index (cardid);
show create table member;
(3)创建表的时候指定
CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名));
create table test02 (id int(4),name varchar(20),unique id_index (id));
show create table test02;
3、主键索引
- 是一种特殊的唯一索引,必须指定为"PRIMARY KEY"。一个表只能有一个主键,不允许有空值。
添加主键将自动创建主键索引。
(1)创建表的时候指定
CREATE TABLE 表名 ([...],PRIMARY KEY (列名));
create table test1 (id int primary key,name varchar(20));
#创建表的时候创建主键(系统在创建主键的时候会自动创建索引)
create table test2 (id int,name varchar(20),primary key (id));
#创建表的时候,加入主键索引,指向字段id
show create table test1;
show cterte table test2;
#查询创建的主键索引
(2)修改表方式创建
ALTER TABLE 表名 ADD PRIMARY KEY (列名);
alter table test1 add primary key (name);
4、组合索引(单列索引与多列索引)
- 可以是单列上创建的索引,也可以是在多列上创建的索引。需要满足最左原则,因为 select 语句的 where 条件是依次从左往右执行的,所以在使用 select 语句查询时 where 条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。
CREATE TABLE 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型,INDEX 索引名 (列名1,列名2,列名3));
select * from 表名 where 列名1='...' AND 列名2='...' AND 列名3='...';
create table test01 (id int not null,name varchar(20),cardid varchar(20),index index_test01 (id,name));
#创建一个表,定义字段和组合索引
show create table test01;
#查看表的内容
insert into test01 values(1,'zhangsan','123456');
#插入一条数据
select * from test01 where name='zhangsan' and id=1;
#组合查看数据内容
5、全文索引(FULLTEXT)
- 适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。
- 在 MySQL5.6 版本以前FULLTEXT 索引仅可用于 MyISAM 引擎;
- 在 5.6 版本之后 innodb 引擎也支持 FULLTEXT 索引。
- 全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。每个表只允许有一个全文索引。
(1)直接创建索引
CREATE FULLTEXT INDEX 索引名 ON 表名 (列名);
select * from member;
create fulltext index remark_index on member (remark);
show create table member;
(2)修改表方式创建
ALTER TABLE 表名 ADD FULLTEXT 索引名 (列名);
alter table member add fulltext name_index (name);
show create table member;
(3)创建表的时候指定索引
CREATE TABLE 表名(字段1 数据类型[,...],FULLTEXT 索引名(列名));
#数据类型可以为CHAR、VARCHAR或者TEXT
create table test01(id int(4),name char(10),genter char(2), age int(2),address char(20),fulltext index suoyin_index(address));
show create table test01;
(4)使用全文索引查询
SELECT * FROM 表名 WHERE MATCH (列名) AGAINST('查询内容');
select * from member where match(name) against('lisi');
或者
select * from member where name='lisi';
1、查看索引
#两个命令查看的信息一样,选其一即可。
show index from 表名;#直接使用因为表格过长可以在后面加上\G方便观看
或者
show keys from 表名;
#--------------查看每个字段的解释----------------
各字段的含义如下:
Table:表的名称。
Non_unique:如果索引不能包括重复词,则为 0;如果可以,则为 1。
Key_name:索引的名称。
Seq_in_index:索引中的列序号,从 1 开始。
Column_name:列名称。
Collation:列以什么方式存储在索引中。在 MySQL 中,有值‘A’(升序)或 NULL(无分类)。
Cardinality:索引中唯一值数目的估计值。
Sub_part:如果列只是被部分地编入索引,则为被编入索引的字符的数目。如果整列被编入索引,则为 NULL。
Packed:指示关键字如何被压缩。如果没有被压缩,则为 NULL。
Null:如果列含有 NULL,则含有 YES。如果没有,则该列含有 NO。
Index_type:用过的索引方法(BTREE, FULLTEXT, HASH, RTREE)。
Comment:备注。
2、删除索引
(1)直接删除索引
DROP INDEX 索引名 ON 表名;
(2)修改表方式删除索引
ALTER TABLE 表名 DROP INDEX 索引名;
alter table member drop index phone_index;
show create table member;
(3)删除主键索引
ALTER TABLE 表名 DROP PRIMARY KEY;
3、索引的排序
select id from member;
案例:比如为某商场做一个会员卡的系统。这个系统有一个会员表,有下列字段:
会员编号 INT
会员姓名 VARCHAR (10)
会员身份证号码 INT (18)
会员电话 INT (11)
会员住址 VARCHAR (50)
会员备注信息 TEXT
create table member (id int(10),name varchar(10),cardid varchar(10),phone int(11),address varchar(50),remark text);
alter table member add primary key(id);
create index name_index on member (name);
create unique index cardid_index on member(cardid);
alter table member add fulltext remark_index (remark);
那么会员编号,作为主键,使用 PRIMARY KEY
会员姓名,如果要建索引的话,那么就是普通的 INDEX
会员身份证号码,如果要建索引的话,那么可以选择 UNIQUE(唯一的,不允许重复)
会员备注信息,如果需要建索引的话,可以选择 FULLTEXT,全文搜索。
不过 FOLLTEXT 用于搜索很长一篇文章的时候,效果最好。用在比较短的文本,如果就一两行字的,普通的 INDEX也可以。
四、MySQL死锁、悲观锁、乐观锁
锁机制是为了避免,在数据库有并发事务的时候,可能会产生数据的不一致而诞生的的一个机制。
锁从类别上分为:
共享锁:又叫做读锁,当用户要进行数据的读取时,对数据加上共享锁,共享锁可以同时加上多个。
排他锁:又叫做写锁,当用户要进行数据的写入时,对数据加上排他锁,排他锁只可以加一个,他和其他的排他锁,共享锁都相斥。
MySQL有三种锁的级别:页级、表级、行级
表级锁:开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低。
行级锁:开销大,加锁慢;会出现死锁;锁定粒度最小,发生锁冲突的概率最低,并发度也最高。
页面锁:开销和加锁时间界于表锁和行锁之间;会出现死锁;锁定粒度界于表锁和行锁之间,并发度
1.死锁
MyISAM中是不会产生死锁的,因为MyISAM总是一次性获得所需的全部锁,要么全部满足,要么全部等待。而在InnoDB中,锁是逐步获得的,就造成了死锁的可能。
两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程。
2.产生死锁的原因
系统资源不足。
进程运行推进的顺序不合适。
资源分配不当等。
如果系统资源充足,进程的资源请求都能够得到满足,死锁出现的可能性就很低,否则就会因争夺有限的资源而陷入死锁。其次,进程运行推进顺序与速度不同,也可能产生死锁。
产生死锁的四个必要条件
3.死锁的四大要素
死锁4大要素:互斥,持有并请求,不可剥夺,持续等待
互斥条件:一个资源每次只能被一个进程使用。
请求与保持条件:一个进程因请求资源而阻塞时,对已获得的资源保持不放。
不剥夺条件:进程已获得的资源,在末使用完之前,不能强行剥夺。
循环等待条件:若干进程之间形成一种头尾相接的循环等待资源关系。
这四个条件是死锁的必要条件,只要系统发生死锁,这些条件必然成立,而只要上述条件之一不满足,就不会发生死锁。
解决方法
撤消陷于死锁的全部进程;
逐个撤消陷于死锁的进程,直到死锁不存在;
从陷于死锁的进程中逐个强迫放弃所占用的资源,直至死锁消失。
从另外一些进程那里强行剥夺足够数量的资源分配给死锁进程,以解除死锁状态
4.如何避免死锁
使用事务时,尽量缩短事务的逻辑处理过程,及早提交或回滚事务;
设置死锁超时参数为合理范围,如:3分钟-10分种;超过时间,自动放弃本次操作,避免进程悬挂;
优化程序,检查并避免死锁现象出现;
对所有的脚本和SP都要仔细测试,在正式版本之前;
所有的SP都要有错误处理(通过@error);
一般不要修改SQL SERVER事务的默认级别。不推荐强行加锁。
以固定的顺序访问表和行。
大事务拆小。大事务更倾向于死锁,如果业务允许,将大事务拆小。
在同一个事务中,尽可能做到一次锁定所需要的所有资源,减少死锁概率。
降低隔离级别。如果业务允许,将隔离级别调低也是较好的选择,比如将隔离级别从RR调整为RC,可以避免掉很多因为gap锁造成的死锁。
为表添加合理的索引。可以看到如果不走索引将会为表的每一行记录添加上锁,死锁的概率大大增大
分为两种情景:
对于不同事务访问不同的表,尽量做到访问表的顺序一致;
对于不同事务访问相同的表,尽量对记录的id做好排序,执行顺序一致。