内容预知
1.索引的相关知识
1.1 索引的简介
- 索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于c语言的链表通过指针指向数据记录的内存地址)。
- 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。
- 索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
- 索引是表中一列或者若干列值排序的方法。
- 建立索引的目的是加快对表中记录的查找或排序。(加快查询速度、对字段值进行排序)
1.2 索引的优缺点
索引的优点
- 设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。
- 当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。
- 可以降低数据库的I/O成本,并且索引还可以降低数据库的排序成本。
- 通过创建唯一性索引,可以保证数据表中每一行数据的唯一性。
- 可以加快表与表之间的连接。
- 使用分组和排序时,可大大减少分组和排序的时间。
- 建立索引在搜索和恢复数据库中的数据时能显著提高性能。
索引的缺点
-
索引需要占用额外的磁盘空间。
-
对于 MyISAM 引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址。而 InnoDB 引擎的表数据文件本身就是索引文件。(索引文件和数据文件是同一个)在插入和修改数据时要花费更多的时间、消耗更多性能,因为索引也要随之变动。
1.3 索引创建的原则条件
索引虽可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。
- 表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位。
- 记录数超过300行(或500行)的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能。(会影响IO和CPU的性能)
- 经常与其他表进行连接的表,在连接字段上应该建立索引。
- 唯一性太差的字段不适合建立索引。(因为字段值会有重复)
- 更新太频繁地字段不适合创建索引。
- 经常出现在 where 子句中的字段,特别是大表的字段,应该建立索引。
- 在经常进行GROUP BY、ORDER BY的字段上建立索引。
- 索引应该建在选择性高的字段上。(即重复性低的字段)
- 索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引。(大字段建索引会增加磁盘空间,而且搜索起来会影响性能)
此外:当一个表写入多、读取很少的时候,不需要建立索引。唯一性太差的字段、更新太频繁地字段、大字段,不适合做索引。
2. 数据结构上索引的分类
对于MySQL索引的分类,我们可以站在多种不同的方式立场上来区分。可以从数据结构,存储方式和逻辑方式来区分索引的种类。本次我们主要针对逻辑方式的索引进行一系列的运用演示
根据存储方式的不同,MySQL 中常用的索引在物理上分为 B-树索引和 HASH 索引两类,两种不同类型的索引各有其不同的适用范围。
(1)B-树索引
B-树索引又称为 BTREE 索引,目前大部分的索引都是采用 B-树索引来存储的。
B-树索引是一个典型的数据结构,其包含的组件主要有以下几个:
- 叶子节点:包含的条目直接指向表里的数据行。叶子节点之间彼此相连,一个叶子节点有一个指向下一个叶子节点的指针。
- 分支节点:包含的条目指向索引里其他的分支节点或者叶子节点。
- 根节点:一个 B-树索引只有一个根节点,实际上就是位于树的最顶端的分支节点。
基于这种树形数据结构,表中的每一行都会在索引上有一个对应值。因此,在表中进行数据查询时,可以根据索引值一步一步定位到数据所在的行。
B-树索引可以进行全键值、键值范围和键值前缀查询,也可以对查询结果进行 ORDER BY 排序。但 B-树索引必须遵循左边前缀原则,要考虑以下几点约束:
- 查询必须从索引的最左边的列开始。
- 查询不能跳过某一索引列,必须按照从左到右的顺序进行匹配。
- 存储引擎不能使用索引中范围条件右边的列。
(2) 哈希索引
哈希(Hash)一般翻译为“散列”,也有直接音译成“哈希”的,就是把任意长度的输入(又叫作预映射,pre-image)通过散列算法变换成固定长度的输出,该输出就是散列值。
哈希索引也称为散列索引或 HASH 索引。MySQL 目前仅有 MEMORY 存储引擎和 HEAP 存储引擎支持这类索引。其中,MEMORY 存储引擎可以支持 B-树索引和 HASH 索引,且将 HASH 当成默认索引。
HASH 索引不是基于树形的数据结构查找数据,而是根据索引列对应的哈希值的方法获取表的记录行。哈希索引的最大特点是访问速度快,但也存在下面的一些缺点:
- MySQL 需要读取表中索引列的值来参与散列计算,散列计算是一个比较耗时的操作。也就是说,相对于 B-树索引来说,建立哈希索引会耗费更多的时间。
- 不能使用 HASH 索引排序。
- HASH 索引只支持等值比较,如“=”“IN()”或“<=>”。
- HASH 索引不支持键的部分匹配,因为在计算 HASH 值的时候是通过整个索引值来计算的。
3. 逻辑划分中索引种类与管理
从逻辑划分来看,索引的运用主要有五种,分别为:普通索引,唯一索引,主键索引,组合索引和全文索引(模糊索引)
管理数据表中的索引之前,为此专门创建了一个测试用表,来针对本次操作的运用演示 :
mysql> create database test ;
mysql> use test;
mysql> create table if not exists info(
-> id int(5),
-> name char(4),
-> sex char(2),
-> age char(3),
-> adress varchar(20),
-> remark varchar(50) );
3.1 普通索引的创建
建立在普通字段上的索引,没有任何限制。
方式一:直接创建普通索引
CREATE INDEX 索引名 ON 表名 (列名(长度));
#长度可以加也可以不加,添加长度时,则该索引会取每行字段的前几位(即字段的长度)作为索引
方式二:修改表结构的方式创建索引
ALTER TABLE 表名 ADD INDEX 索引名(列名);
方法三:创建表时指定索引
mysql> create table if not exists info(
-> id int(5),
-> name char(4),
-> sex char(2),
-> age char(3),
-> adress varchar(20),
-> remark varchar(50)
-> index 索引名(字段名) );
该方式一般不建议采用:在创建表的时候添加索引,会让插入数据变慢。
3.2 唯一索引的创建
唯一索引:与普通索引类似,但区别是唯一索引列的每个值都唯一。 唯一索引 允许有空值,但是不允许有两个及其以上的空值(注意和主键不同)。
创建唯一键或者创建唯一索引都可实现。
方式一:直接创建唯一索引
CREATE UNIQUE INDEX 索引名 ON 表名(字段名);
方式二:修改表结构的方式增加唯一键
ALTER TABLE 表名 ADD UNIQUE 索引名(字段名);
方式三:创建表时指定索引
mysql> create table if not exists info(
-> id int(5),
-> name char(4),
-> sex char(2),
-> age char(3),
-> adress varchar(20),
-> remark varchar(50)
-> unique 索引名(字段名) );
方法四:添加唯一键,即为唯一索引
alter table 表名 add unique key(字段);
3.3 主键索引的创建
主键索引是一种特殊的唯一索引,必须指定为“PRIMARY KEY”。一个表只能有一个主键,不允许有空值,且该字段为唯一值。 添加主键将自动创建主键索引。
方式一:创建表时添加主键
mysql> create table if not exists info(
-> id int(5),
-> name char(4),
-> sex char(2),
-> age char(3),
-> adress varchar(20),
-> remark varchar(50)
-> primary key (字段) );
方式二: 在现有表中添加主键
ALTER TABLE 表名 add primary key(字段名);
3.4 组合索引的创建
组合索引(单列索引与多列索引):可以是单列上创建的索引,也可以是在多列上创建的索引。
需要满足最左原则,因为select 语句的where条件是依次从左往右执行的,所以在使用select 语句查询时where 条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。
方法一:直接创建索引
CREATE INDEX 索引名 on 表名(字段1,字段2,字段3);
方法二:修改表的方式创建索引
alter table 表名 add index 索引名(字段1,字段2, ..., 字段n);
方法三:创建表的时候指定索引
mysql> create table if not exists info(
-> id int(5),
-> name char(4),
-> sex char(2),
-> age char(3),
-> adress varchar(20),
-> remark varchar(50)
-> idnex 字段1_字段2_index(字段1,字段2) );
组合索引的使用方法
select */需求字段 from 表名 where 索引字段1=? and 索引字段2=? and 索引字段3=?
3.5 全文索引的创建
全文索引(FULLTEXT):适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。
在MySQL5.6版本以前FULLTEXT索引仅可用于MyISAM引擎,在5.6版本之后innodb 引擎也支持FULLTEXT 索引。
全文索引可以在CHAR、 VARCHAR 或者TEXT 类型的列上创建。
每个表一般只创建一个全文索引。
查询时只能匹配完整的单词/字符串。
方法一:直接创建索引
create fulltext index 索引名 on 表名 (字段);
方式二: 修改表的方式创建索引
alter table 表名 add fulltext 索引名 (字段);
方法三:创建表时指定索引
mysql> create table if not exists info(
-> id int(5),
-> name char(4),
-> sex char(2),
-> age char(3),
-> adress varchar(20),
-> remark varchar(50)
-> fulltext idnex 字段_index(字段) );
全文索引在查询中使用方法
select * from 表名 where match(字段名) against(单词/字符串);
3.6 索引删除的通用方式
其他索引的删除方法
drop index 索引名 on 表名; #直接删除索引
alter table 表名 DROP index 索引名; #以修改表的方式删除索引
主键索引的删除方法
alter table 表名 drop primary key;
3.7 查看表中存在全部索引的方法
show index from 表名; #能查看索引的字段和细节,建议以纵向形式查看
show index from 表名\G #建议使用\G以纵向形式查看
show keys from 表名;
show keys from 表名\G
show create table 表名; #只能查看索引的字段和名称
4. explain 语句用法以及mysql查询速度的优化
4.1 explain语句的作用
当我们写好了查询语句不确定自己是否引用的字段是不是索引字段时,可以在查询语句前添加explain来确定自己是否引用了索引字段
explain select * from 表名 where 条件语句;
4.2 mysql查询速度的优化
我们知道mysql的核心功能就是数据的查询,数据查找的速度尤为重要。对于内容条数过多的数据表会产生响应慢的可能。所以查询速度优化是数据库管理员必不可少的工作
硬件上的优化
- CPU对于MySQL应用,推荐使用S.M.P.架构的多路对称CPU,例如:可以使用两颗Intel Xeon 3.6GHz的CPU,现在我较推荐用4U的服务器来专门做数据库服务器,不仅仅是针对于mysql。
- 物理内存对于一台使用MySQL的Database Server来说,服务器内存建议不要小于2GB,推荐使用4GB以上的物理内存,不过内存对于现在的服务器而言可以说是一个可以忽略的问题,工作中遇到了高端服务器基本上内存都超过了16G。
- 磁盘寻道能力(磁盘I/O),以目前高转速SCSI硬盘(7200转/秒)为例,这种硬盘理论上每秒寻道7200次,这是物理特性决定的,没有办法改变。MySQL每秒钟都在进行大量、复杂的查询操作,对磁盘的读写量可想而知。所以,通常认为磁盘I/O是制约MySQL性能的最大因素之一,对于日均访问量在100万PV以上的系统,由于磁盘I/O的制约,MySQL的性能会非常低下!解决这一制约因素可以考虑以下几种解决方案: 使用RAID-0+1磁盘阵列,注意不要尝试使用RAID-5,MySQL在RAID-5磁盘阵列上的效率不会像你期待的那样快。
查询语句进行索引优化
1. 在使用数据查询语句时,发现查询的时间明显缓慢(一般1s钟以上就存在慢的问题),使用explain语句进行分析 (查看是否存在索引,以及该语句是否真正用到了索引)。
2.若该语句中的条件并为涉及索引,可以添加索引来进行优化
3. 索引类型单一,条件语句中条件用到的较多,可以尝试组合索引,以此加快查询速度
总结
(1)创建索引
1)普通索引:
create index 索引名 on 表名 (字段);
alter table 表名 add index 索引名 (字段(4));
create table 表名 (字段.... , index 索引名(字段));
2)唯一索引:
create unique index 索引名 on 表名 (字段);
alter table 表名 add unique 索引名(字段);
create table 表名 (字段.... , unique 索引名(字段));
3)主键索引:
alter table 表名 add primary key (字段);
create table 表名 (字段.... , primary key (字段));
create table 表名 (字段 primary key, ... );
4)组合索引(单列、多列索引):
create index XXX_index on 表名 (字段1,字段2, ... , 字段n);
alter table 表名 add index XXX_index (字段1,字段2, ... , 字段n);
create table 表名(列名1 数据类型,列名2 数据类型,列名3 数据类型, INDEX 索引名(字段1,字段2,字段3));
使用时要注意 where 的最左原则:
select * from 表名 where 字段1=XXX and 字段2=XXX and ....
5)全文索引:
create fulltext index 索引名 on 表名 (字段);
alter table 表名 add fulltext 索引名 (字段);
create table 表名 (字段.... , fulltext 索引名(字段));
查询时只能匹配完整的字符串:
select * from 表名 where match(字段) against('查询字符串');
(2)查看表中存在的索引
show index from 表名; //能查看索引的字段和细节,建议使用\G纵向查看
show keys from 表名;
show create table 表名; //只能查看索引的字段和名称
(3)删除索引
删除主键索引的方法:
alter table 表名 drop primary key;
删除其他索引:
drop index 索引名 on 表名;
alter table 表名 drop index 索引名;
(4)explain语句
explain添加在查询语句前面,可以分析出该语句是否使用了索引,以及具体使用索引的字段