什么是索引?为什么要建立索引?索引分类?索引的使用?转载SQL(五) MySQL中的索引详讲
一、索引介绍:
索引用于快速找出在某个列中有一特定值的行。不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大查询数据所花费的时间就越多。如果表中查询的列有索引,MySQL能够快速到达一个位置去搜索数据文件,而不必查看所有数据,那么将会节省很大一部分时间。
例如:有一张person表,其中有2W条记录,记录着2W个人的信息。有一个Phone的字段记录每个人的电话号码,现在想要查询出电话号码为xxxx的人的信息。
如果没有索引,那么将从表中第一条记录一条条往下遍历,直到找到该条信息为止。
如果有了索引,那么会将 Phone 字段,通过一定的方法进行存储,好让查询该字段上的信息时,能够快速找到对应的数据,而不必在遍历2W条数据了。其中MySQL中的索引的存储类型有两种:BTREE、HASH。 也就是用树或者Hash值来存储该字段,更详细的查找逻辑就需要会算法的知识了。我们现在只需要知道索引的作用,功能是什么就行。
二、索引优缺点:
优点:
1、所有的MySql列类型(字段类型)都可以被索引,也就是可以给任意字段设置索引。
2、大大加快数据的查询速度。
缺点:
1、创建索引和维护索引要耗费时间,并且随着数据量的增加所耗费的时间也会增加。
2、索引也需要占空间,我们知道数据表中的数据也会有最大上线设置的,如果我们有大量的索引,索引文件可能会比数据文件更快达到上线值。
3、当对表中的数据进行增加、删除、修改时,索引也需要动态的维护,降低了数据的维护速度。
使用原则:
通过上面说的优点和缺点,我们应该可以知道,并不是每个字段都设置为索引好,也不是索引越多越好,而是需要自己合理的使用。
1、对经常更新的表就避免对其设置过多的索引,对经常用于查询的字段应该创建索引。
2、数据量小的表最好不要使用索引,因为由于数据较少,可能查询全部数据花费的时间比遍历索引的时间还要短,索引就可能不会产生优化效果。
3、在一个列上(字段上)不同值较少的不要建立索引,比如在学生表的"性别"字段上只有男,女两个不同值。相反的,在一个字段上不同值较多的可是建立索引。
以上简单的说下索引的优缺点,在以后的使用中再慢慢总结。
三、索引的分类
索引是在存储引擎中实现的,也就是说不同的存储引擎,会使用不同的索引:
MyISAM和InnoDB存储引擎:只支持BTREE索引, 也就是说默认使用BTREE,不能够更换。(但是innoDB存储引擎支持hash索引是自适应的,innoDB存储引擎会根据表的使用情况自动为表生成hash索引,不能人为干预是否在一张表中生成hash索引。后续再整理)
MEMORY/HEAP存储引擎:支持HASH和BTREE索引。
存储引擎的类型及特点:
引擎名称
优点
缺陷
应用场景
MyISAM
独立于操作系统,这说明可以轻松地将其从Windows服务器移植到Linux服务器
不支持事务/行级锁/外键约束
适合管理邮件或Web服务器日志数据
InnoDB
健壮的事务型存储引擎;支持事务/行级锁/外键约束自动灾难恢复/AUTO_INCREMENT
需要事务支持,并且有较高的并发读取频率
MEMORY
为得到最快的响应时间,采用的逻辑存储介质是系统内存
当mysqld守护进程崩溃时,所有的Memory数据都会丢失;不能使用BLOB和TEXT这样的长度可变的数据类型
临时表
MERGE
是MyISAM类型的一种变种。合并表是将几个相同的MyISAM表合并为一个虚表
常应用于日志和数据仓库
ARCHIVE
归档的意思,支持索引,拥有很好的压缩机制
仅支持插入和查询功能
经常被用来当做仓库使用
索引我们分为四类:单列索引(普通索引,唯一索引,主键索引)、组合索引、全文索引、空间索引。
单列索引:一个索引只包含单个列,但一个表中可以有多个单列索引。 这里不要搞混淆了。
1、普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。
2、唯一索引:索引列中的值必须是唯一的,但是允许为空值,
3、主键索引:是一种特殊的唯一索引,不允许有空值。
组合索引:一个的索引包含多个列,只有在查询条件中使用了这些字段的左边字段时,索引才会被使用,使用组合索引时遵循最左前缀。会在后面的例子细说。
全文索引:要求只有在MyISAM引擎上才能使用,只能在CHAR、VARCHAR、TEXT类型字段上使用全文索引。就是在一堆文字中,通过其中的某个关键字等,就能找到该字段所属的记录行,比如有"你是个大煞笔,二货 ..." 通过大煞笔,可能就可以找到该条记录。这里说的是可能,因为全文索引的使用涉及了很多细节。具体文章
空间索引:空间索引是对空间数据类型的字段建立的索引,MySQL中的空间数据类型有四种,GEOMETRY、POINT、LINESTRING、POLYGON。
在创建空间索引时,使用SPATIAL关键字。
要求,引擎为MyISAM,创建空间索引的列,必须将其声明为NOT NULL。具体细节看下面
四、索引使用
Ⅰ、在创建表时创建索引:
创建索引:单列索引(普通、唯一、主键)、组合索引、全文索引和空间索引。
格式:CREATE TABLE 表名[字段名 数据类型] [UNIQUE|FULLTEXT|SPATIAL|...] [INDEX|KEY] [索引名字] (字段名[length])
1、创建普通索引:
## 创建普通索引,创建索引时未指定索引的名,会自动帮我们用字段名当作索引名
CREATE TABLE book(
id INT NOT NULL PRIMARY KEY,
name VARCHAR(50) NOT NULL,
author VARCHAR(20) NOT NULL,
info VARCHAR(255) NULL,
INDEX(author));
## 查看表的创建
SHOW CREATE TABLE book;
-------------------------------结果----------------------------------
CREATE TABLE `book` (
`id` int(11) NOT NULL,
`name` varchar(50) NOT NULL,
`author` varchar(20) NOT NULL,
`info` varchar(255) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `author` (`author`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
## 用EXPLAIN关键字,来查看索引是否正在被使用,并且输出其使用的索引信息
EXPLAIN SELECT * FROM book WHERE author = 'nana';
---------------------------------结果--------------------------------
虽然表中没数据,但是有EXPLAIN关键字,用来查看索引是否正在被使用,并且输出其使用的索引的信息。
id:为SELECT的识别符。这是SELECT的查询序列号,也就是一条语句中,该select是第几次出现。在上面语句中,select只有一个,所以是1。
select_type:表示使用SELECT的查询类型,SIMPLE表示为简单的SELECT,不适用于UNION或子查询,就是简单的SELECT。也就是说该SELECT查询时会使用索引。其他取值:
PRIMARY:最外面的SELECT,在有子查询时,就会出现两个以上的SELECT。
UNION:union(两张表连接)中的第二个或后面的select语句。
SUBQUERY:在子查询中,第二个SELECT。
table:数据表的名字。按照被读取的先后顺序排列,这里只查询一张表,所以只显示book。
type:指定本数据表和其他数据表之间的关联关系,该表中所有符合检索值的记录都会被取出来和从上一个表中取出来的记录作联合。
ref用于连接程序使用键的最左前缀或者是该键不是 primary key 或 unique索引(换句话说,就是连接程序无法根据键值只取得一条记录)的情况。当根据键值只查询到少数几条匹配的记录时,这就是一个不错的连接类型。(注意,个人这里不是很理解,百度了很多资料,全是大白话,等以后用到了这类信息时,在回过头来补充,这里不懂对后面的影响不大。)可能的取值有 system、const、eq_ref、index和All。
possible_keys:MySQL在搜索数据记录时可以选用的各个索引。目前表里有两个索引一个是主键一个是anthor。因为目前表里没有数据,所以主键索引未被使用。
key:实际选用的索引。
key_len:显示了mysql使用索引的长度(也就是使用的索引个数),当 key 字段的值为 null时,索引的长度就是 null。注意,key_len的值可以告诉你在联合索引中mysql会真正使用了哪些索引。
ref:给出关联关系中另一个数据表中数据列的名字。常量(const),这里使用的是'nana',就是常量。
rows:MySQL在执行这个查询时预计会从这个数据表里读出的数据行的个数。
extra:提供了与关联操作有关的信息,没有则什么都不写。
上面的一大堆东西能看懂多少看多少,我们最主要的是看 possible_keys 和 key 这两个属性,上面显示了key为anthor。说明使用了索引。
2、创建唯一索引:
## 创建唯一索引
CREATE TABLE tab1(
id INT(5) NOT NULL,
name CHAR(20) NOT NULL,
UNIQUE INDEX uniqId(id)
);
## 查看表的创建
SHOW CREATE TABLE tab1;
---------------------------------结果--------------------------------
CREATE TABLE `tab1` (
`id` int(5) NOT NULL,
`name` char(20) NOT NULL,
UNIQUE KEY `uniqId` (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
## 查看索引使用信息
EXPLAIN SELECT * FROM tab1 WHERE id = 1;
---------------------------------结果--------------------------------
EXPLAIN SELECT * FROM tab1 WHERE id = 2;
---------------------------------结果--------------------------------
可以看到,通过id查询时,会使用唯一索引。并且还实验了查询一个没有的id值,则不会使用索引,我觉得原因是所有的id应该会存储到一个const tables中,如果没有该id值,那么就没有查找的必要了。
3、创建主键索引:
## 创建主键索引
CREATE TABLE tab2(
id INT(4) NOT NULL,
name char(20) DEFAULT NULL,
PRIMARY KEY(id));
## 查看表的创建
SHOW CREATE TABLE tab2;
---------------------------------结果--------------------------------
CREATE TABLE `tab2` (
`id` int(4) NOT NULL,
`name` char(20) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
## 插入数据,查看下索引的使用,不然没有id的值索引不会被使用
INSERT INTO tab2 VALUES(1,'nana');
## 查看索引使用信息
EXPLAIN SELECT * FROM tab2 WHERE id = 1;
---------------------------------结果--------------------------------
4、创建组合索引:
## 创建组合索引
CREATE TABLE tab3(
id INT(4) NOT NULL,
name CHAR(20) NOT NULL,
age INT(3) NOT NULL,
info VARCHAR(255),
INDEX multiIdx(id,name,age)
);
## 查看表的创建
SHOW CREATE TABLE tab3;
---------------------------------结果--------------------------------
CREATE TABLE `tab3` (
`id` int(4) NOT NULL,
`name` char(20) NOT NULL,
`age` int(3) NOT NULL,
`info` varchar(255) DEFAULT NULL,
KEY `multiIdx` (`id`,`name`,`age`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
## 查看索引使用信息
EXPLAIN SELECT * FROM tab3 WHERE id = 1 AND name = 'nana';
---------------------------------结果--------------------------------
EXPLAIN SELECT * FROM tab3 WHERE age = 3 AND name = 'nana';
---------------------------------结果--------------------------------
最左前缀:组合索引遵从了最左前缀,利用索引中最左边的列集来匹配行,这样的列集称为最左前缀。例如,这里由id、name和age3个字段构成的索引,索引行中就按id/name/age的顺序存放,索引组合中的字段可以是(id,name,age)、(id,name)或者(id)。如果要查询的字段不构成最左面的前缀原则,那么就不会用索引,比如,age或者(name,age)组合就不会使用索引查询。
4、创建全文索引:
## 创建全文索引,支持的字段类型为CHAR、VARCHAR和TEXT,存储引擎为MyISAM
CREATE TABLE tab4(
id INT(4) NOT NULL,
name CHAR(20) NOT NULL,
age INT(3) NOT NULL,
info VARCHAR(255),
FULLTEXT INDEX fullTxtIdx(info)
)ENGINE=MyISAM;
## 查看表的创建
SHOW CREATE TABLE tab4;
---------------------------------结果--------------------------------
CREATE TABLE `tab4` (
`id` int(4) NOT NULL,
`name` char(20) NOT NULL,
`age` int(3) NOT NULL,
`info` varchar(255) DEFAULT NULL,
FULLTEXT KEY `fullTxtIdx` (`info`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8
## 插入数据,查看下索引的使用
INSERT INTO tab4 VALUES(1,'AAA',3,'text is so good,hei,my name is black'),(2,'BBB',4,'my name is white');
## 全文搜索
## 未找到结果,不知道为什么
SELECT * FROM tab4 WHERE MATCH(info) AGAINST('white');
## 查看索引使用信息
EXPLAIN SELECT * FROM tab4 WHERE MATCH(info) AGAINST('white');
---------------------------------结果--------------------------------
5、创建空间索引:
## 创建空间索引
CREATE TABLE tab5(
geo GEOMETRY NOT NULL,
SPATIAL INDEX spatIdx(geo)
)ENGINE=MyISAM;
## 查看表的创建
SHOW CREATE TABLE tab5;
---------------------------------结果--------------------------------
CREATE TABLE `tab5` (
`geo` geometry NOT NULL,
SPATIAL KEY `spatIdx` (`geo`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8
Ⅱ、在创建表后创建索引:
## 在已经存在的表上创建索引
ALTER TABLE 表名 ADD[UNIQUE|FULLTEXT|SPATIAL] [INDEX|KEY] [索引名] (索引字段名(长度))
## 查看表的索引
SHOW INDEX FROM book;
---------------------------------结果--------------------------------
Table:创建索引的表。
Non_unique:表示索引是否唯一,其中1代表:非唯一索引, 0代表:唯一索引。
Key_name:索引名称。
Seq_in_index:表示该字段在索引中的位置,单列索引该值为1,组合索引为每个字段在索引定义中的顺序(这个只需要知道单列索引该值为1,组合索引为别的)。
Column_name:表示定义索引的列字段。
Sub_part:表示索引的长度,当字段值为null时,索引长度为null。
Null:表示该字段是否能为空值。
Index_type:表示索引类型。
## 为表添加索引
ALTER TABLE book ADD INDEX BkNameIdx(name(30));
## 查看表的索引
SHOW INDEX FROM book;
---------------------------------结果--------------------------------
## 使用CREATE INDEX创建索引
CREATE [UNIQUE|FULLTEXT|SPATIAL] [INDEX|KEY] 索引名称 ON 表名(创建索引的字段名[length])
## 为book表增加一个普通索引info。字段为CHAR,VARCHAR类型时,索引length可以小于字段实际长度;如果是BLOB和TEXT类型,必须指定 length
CREATE INDEX BkInfoIdx ON book(info(10));
## 查看表的索引
SHOW INDEX FROM book;
---------------------------------结果--------------------------------
Ⅲ、删除索引:
## 使用ALTER DROP删除索引
ALTER TABLE 表名 DROP INDEX 索引名
## 删除book表中的名称为BkInfoIdx的索引
ALTER TABLE book DROP INDEX BkInfoIdx;
## 查看表的索引
SHOW INDEX FROM book;
---------------------------------结果--------------------------------
## 使用DROP INDEX删除索引
DROP INDEX 索引名 ON 表名;
## 删除book表中的名称为BkNameIdx的索引
DROP INDEX BkNameIdx ON book;
## 查看表的索引
SHOW INDEX FROM book;
---------------------------------结果--------------------------------
五、总结
MySQL的索引到这里差不多就讲完了,总结一下我们到目前为止应该知道哪些东西
1、索引是干嘛的?为什么要有索引?
这个很重要,需要自己理解一下,不懂可以多看几遍索引介绍。
2、索引的分类:单列索引(普通索引、唯一索引和主键索引)、组合索引、全文索引和空间索引。
3、索引的使用:
给表中创建索引,添加索引,删除索引。