目录
一、索引的概念
目的:数据库利用各种快速定位技术,能够大大加快查询速度
1、索引的概念
- 索引是一个排序的列表,在这个列表中存储着缩影的值和包含这个值的数据所在行的物理地址(类似于c语言的链表通过指针指向数据记录的内存地址)。
- 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引找到该行数据对应的物理地址,然后访问相应的数据,因此能加快数据库的查询速度。
- 索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
- 索引是表中一列或者若干列排序的方法。
- 建立索引的目的就是加快对表中记录的查找或排序。
- 需要额外的磁盘空间
2、索引优点和缺点
索引的优点
- 设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要原因。
- 当表很大或查询涉及到多个表时,使用索引可以成千上万的提高查询速度。
- 可以降低数据库的IO成本,并且还可以降低数据库的排序成本。
- 通过创建唯一键性索引保证数据表数据的唯一性。
- 可以加快表与表之间的连接。
- 在使用分组和排序时,可大大减少分组和排序时间。
总结:提高查询速度,降低IO成本,加快表与表连接,减少分组排序时间
索引的缺点
- 索引需要占用额外的磁盘空间
对于myisam引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址,而innode引擎的表数据文件本身就是索引文件。
- 在插入和修改数据时需要花费更多的时间,因为索引也要随之变动。
- 数据库在执行select这类的查询语句时,会先遍历索引表,如果无效、无用的索引,反而会增加数据的查询时间消耗。
3、创建索引的原则依据
索引虽然可以提升数据库查询的速度,但是并不是任何情况下都适合创建索引,因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进性索引查询,然后定位到具体的数据行,如果索引使用不当,反而还会增加数据库的负担。
- 表的主键、外键必须有索引,因为主键具有唯一性,外键关联的是子表的主键,查询时,可以快速定位。
- 记录数超过300行的表应该有索引,如果没有索引,需要把表遍历一遍,会严重影响数据库的性能。
- 经常与其它表进行连接的表,在连接字段上应该建立索引。
以上三条总结:①具有唯一性,②被查询的频次较高的字段,③表的记录超过300行以上的。适合创建字段
- 索引应该建在选择性高的字段上。(经常被查询的字段)
- 经常出现where子句中的字段,特别是大表的字段,应该建立索引。
- 唯一性太差的字段不适合建立索引。
- 更新太平频繁的字段不适合创建索引。
- 索引应该建在小字段上,对于大的文本字段,甚至超长字段,不要建立索引。
创建索引的目的本身就是一种mysql优化方式,根据以上创建索引的原则依据,总结以下适合创建索引的字段场景。
- 小字段
- 唯一性强的字段
- 更新不频繁,但查询率很高的字段
- 表记录超过300+行
- 主键、外键、唯一键
二、索引的分类和创建
以下的操作都基于此模板表来进行操作
crate database jn;
use jn
create table roster (id int(10),name varchar(10),cardid varchar(18),phone varchar(11),address varchar(50),remark text);
insert into roster values(1,'zhangsan','123','111111','nanjin','this is vip');
insert into roster values(2,'lisi','1234','222222','nanjin','this is novip');
insert into roster values(3,'wangwu','12345','333333','beijing','this is svip');
insert into roster values(4,'zhaoliu','123456','444444','sahnghai','this is ssvip');
insert into roster values(5,'qianqi','1234567','555555','suzhou','this is novip');
1、普通索引
直接创建索引
最基本的索引类型,没有唯一性之类的限制
格式: create index 索引名 on 表名 (列名[(length)]);
- 索引名建议以“ _index”结尾
- 列名: length是可选项,如果忽略length的值,则使用猪呢个股列的值作为索引,如果指定使用列前的length个字符来创建索引,这样有利于减小索引文件的大小。
CREATE INDEX 索引名 ON 表名 (列名[(length)]);
#(列名(length)):length是可选项。
如果忽略 length 的值,则使用整个列的值作为索引。
如果指定使用列前的 length 个字符来创建索引,这样有利于减小索引文件的大小。
#索引名建议以“_index”结尾。
例:create index phone_index on roster (phone);
select phone from roster;
show create table roster;
修改表方式创建
ALTER TABLE 表名 ADD INDEX 索引名 (列名);
例:alter table roster add index id_index (id);
select id from roster;
select id,name from roster;
创建表的时候指定索引
CREATE TABLE 表名 ( 字段1 数据类型,字段2 数据类型[,...],INDEX 索引名 (列名));
例:create table roster2(id int(4) not null,name varchar(10) not null,
cardid varchar(20) not null,index id_index (id));
show create table roster2;
2、唯一索引
与普通索引类似,但区别是唯一索引列的每个值都唯一。唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。
直接创建唯一索引
CREATE UNIQUE INDEX 索引名 ON 表名(列名);
例:select * from roster;
create unique index address_index on roster (address);
create unique index name_index on roster (name);
show create table roster;
修改表方式创建
ALTER TABLE 表名 ADD UNIQUE 索引名 (列名);
例:alter table roster add unique cardid_index (cardid);
创建表的时候指定
CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名));
例:create table roster3 (id int(4),name varchar(20),unique id_index (id));
show create table roster3;
3、主键索引
是一种特殊的唯一索引,必须指定为“PRIMARY KEY”。一个表只能有一个主键,不允许有空值。 添加主键将自动创建主键索引。
创建表的时候指定
CREATE TABLE 表名 ([...],PRIMARY KEY (列名));
例:create table roster4 (id int primary key,name varchar(20));
create table roster5 (id int,name varchar(20),primary key (id));
show create table roster4\G
show create table roster5\G
修改表方式创建
ALTER TABLE 表名 ADD PRIMARY KEY (列名);
4、组合索引
可以是单列上创建的索引,也可以是在多列上创建的索引。
CREATE TABLE 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型,INDEX 索引名 (列名1,列名2,列名3));
select * from 表名 where 列名1='...' AND 列名2='...' AND 列名3='...';
例:create table roster6 (id int not null,name varchar(20),cardid varchar(20),index index_amd (id,name));
show create table roster6;
insert into roster6 values(1,'zhangsan','123123');
select * from roster6 where name='zhangsan' and id=1;
组合索引创建的字段顺序是其触发索引的查询顺序
--+
| CLASS | CREATE TABLE "member" (
"id" int(11) NOT NULL,
"name" varchar(50) DEFAULT NULL,
"age" int(5) DEFAULT NULL,
KEY "index_idname" ("id","name")
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |
对以上的表进行select
select id,name from member; #会触发组合索引
而:
select name,id from member; #按照索引从左到右检索的顺序,则不会触发组合索引
大量数据才能展示是否出发组合索引,未触发查询速度慢。
5、全文索引
适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。在 MySQL5.6 版本以前FULLTEXT 索引仅可用于 MyISAM 引擎,在 5.6 版本之后 innodb 引擎也支持FULLTEXT 索引。
全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。每个表只允许有一个全文索引。
直接创建索引
CREATE FULLTEXT INDEX 索引名 ON 表名 (列名);
例:select * from member;
create fulltext index remark_index on class (remark);
PS:全文索引只能在char、varchar、text类型中创建,且每个表只允许有一个全文索引
修改表方式创建
ALTER TABLE 表名 ADD FULLTEXT 索引名 (列名);
创建表的时候指定索引
CREATE TABLE 表名 (字段1 数据类型[,...],FULLTEXT 索引名 (列名));
使用全文索引查询
SELECT * FROM 表名 WHERE MATCH(列名) AGAINST('查询内容');
例:select * from class where match(remark) against('this is VIP');
五、查看索引
show index from 表名;
show index from 表名\G; 竖向显示表索引信息
show keys from 表名;
show keys from 表名\G;
字段的含义如下:
Table 表的名称
Non_unique 如果索引不能包括重复词,则为 0;如果可以,则为 1。
Key_name 索引的名称。
Seq_in_index 索引中的列序号,从 1 开始。
Column_name 列名称。
Collation 列以什么方式存储在索引中。在 MySQL 中,有值‘A’(升序)或 NULL(无分类)。
Cardinality 索引中唯一值数目的估计值。
Sub_part 如果列只是被部分地编入索引,则为被编入索引的字符的数目。如果整列被编入索引,则为 NULL。
Packed 指示关键字如何被压缩。如果没有被压缩,则为 NULL。
Null 如果列含有 NULL,则含有 YES。如果没有,则该列含有 NO。
Index_type 用过的索引方法(BTREE, FULLTEXT, HASH, RTREE)。
Comment 备注
六、删除索引
1、直接删除索引
DROP INDEX 索引名 ON 表名;
例:drop index name_index on member;
2、修改表方式删除索引
ALTER TABLE 表名 DROP INDEX 索引名;
例:alter table member drop id_index;
show index from member;
3、删除主键索引
ALTER TABLE 表名 DROP PRIMARY KEY;
死锁
死锁:是指两个或两个以上的进程(或线程)在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去。
产生死锁的必要条件:
- 互斥条件:所谓互斥就是进程在某一时间内独占资源。
- 请求与保持条件:一个进程因请求资源而阻塞时,对已获得的资源保持不放。
- 不剥夺条件:进程已获得资源,在末使用完之前,不能强行剥夺。
- 循环等待条件:若干进程之间形成一种头尾相接的循环等待资源关系。
活锁
活锁:任务或者执行者没有被阻塞,由于某些条件没有满足,导致一直重复尝试,失败,尝试,失败。
活锁和死锁的区别在于,处于活锁的实体是在不断的改变状态,所谓的“活”, 而处于死锁的实体表现为等待;活锁有可能自行解开,死锁则不能。
饥饿:一个或者多个线程因为种种原因无法获得所需要的资源,导致一直无法执行的状态。
导致饥饿的原因:
- 高优先级线程吞噬所有的低优先级线程的CPU时间。
- 线程被永久堵塞在一个等待进入同步块的状态,因为其他线程总是能在它之前持续地对该同步块进行访问。
- 线程在等待一个本身也处于永久等待完成的对象(比如调用这个对象的wait方法),因为其他线程总是被持续地获得唤醒
乐观锁
乐观锁:顾名思义,就是很乐观,每次去拿数据的时候都认为别人不会修改,所以不会上锁,但是在更新的时候会判断一下在此期间别人有没有去更新这个数据,可以使用版本号等机制。乐观锁适用于多读的应用类型,这样可以提高吞吐量,像数据库提供的类似于write_condition机制,其实都是提供的乐观锁。在Java中java.util.concurrent.atomic包下面的原子变量类就是使用了乐观锁的一种实现方式CAS实现的。
乐观锁的实现方式:
使用版本标识来确定读到的数据与提交时的数据是否一致。提交后修改版本标识,不一致时可以采取丢弃和再次尝试的策略。
java中的Compare and Swap即CAS ,当多个线程尝试使用CAS同时更新同一个变量时,只有其中一个线程能更新变量的值,而其它线程都失败,失败的线程并不会被挂起,而是被告知这次竞争中失败,并可以再次尝试。 CAS 操作中包含三个操作数 —— 需要读写的内存位置(V)、进行比较的预期原值(A)和拟写入的新值(B)。如果内存位置V的值与预期原值A相匹配,那么处理器会自动将该位置值更新为新值B。否则处理器不做任何操作。
CAS缺点:
- ABA问题:
比如说一个线程one从内存位置V中取出A,这时候另一个线程two也从内存中取出A,并且two进行了一些操作变成了B,然后two又将V位置的数据变成A,这时候线程one进行CAS操作发现内存中仍然是A,然后one操作成功。尽管线程one的CAS操作成功,但可能存在潜藏的问题。从Java1.5开始JDK的atomic包里提供了一个类AtomicStampedReference来解决ABA问题。
- 循环时间长开销大:
对于资源竞争严重(线程冲突严重)的情况,CAS自旋的概率会比较大,从而浪费更多的CPU资源,效率低于synchronized。
- 只能保证一个共享变量的原子操作:
当对一个共享变量执行操作时,我们可以使用循环CAS的方式来保证原子操作,但是对多个共享变量操作时,循环CAS就无法保证操作的原子性,这个时候就可以用锁。
悲观锁
悲观锁:总是假设最坏的情况,每次去拿数据的时候都认为别人会修改,所以每次在拿数据的时候都会上锁,这样别人想拿这个数据就会阻塞直到它拿到锁。传统的关系型数据库里边就用到了很多这种锁机制,比如行锁,表锁等,读锁,写锁等,都是在做操作之前先上锁。再比如Java里面的同步原语synchronized关键字的实现也是悲观锁。