一、索引官方定义
1、索引是帮助mysql高效获取数据的数据结构;即索引是数据结构。
索引的目的在于提高查询效率,可以类比字典。比如要查"mysql"这个单词,我们首先需要定位到m字母,然后从下往上找到y字母,再找剩下的sql。如果没有索引,那么你可能需要从a--------z全扫;如果想找到java开头的单词呢?...如果没有索引,完成这个事情估计很费劲!
2、可以简单的理解索引为“排好序的快速查找数据结构”
在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法。这种数据结构,就是索引。下图就是一种可能的索引方式示例:
一般来说,索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上。
就我们平常所说的索引,如果没有特别指明,都是指B树(多路搜索树,并不一定是二叉树)结构组织的索引。其中聚集索引,次要索引,覆盖索引,复合索引,前缀索引,唯一索引默认都是使用B+树索引,统称索引。当然,处了B+树这种类型的索引之外,还要hash索引(hash index)等。
二、索引的优劣
1、优点
a、类似大学图书馆建书目索引,提高数据检索的效率,降低数据库的IO成本;
b、通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗;
2、缺点
a、实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引列也是要占用空间的
b、虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行insert、update、delete。因为更新表时,mysql不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息
c、索引只是提高效率的一个因素,如果你的mysql有大数据量的表,就需要花时间研究建立最优秀的索引,或优化查询语句
三、mysql索引分类
1、单值索引:一个索引只包含单个列,一个表可以有多个单列索引
2、唯一索引:所以列的值必须唯一,但允许有空值
3、复合索引:一个索引包含多个列
创建索引:
create [unique] index indexName on mytable(columnname(length));
alter mytable add [unique] index [indexName] on (columnname(length));
如果是char,varchar类型,length可以小于字段实际长度;如果是blob和text类型,必须指定length
删除索引
drop index [indexname] on mytable;
查看索引
show index from tableName\G
四、mysql索引结构
BTree索引--检索原理:
Hash索引
full-text全文索引
R-tree索引
五、哪些情况下应该建立索引
- 主键自动建立唯一索引
- 频繁作为查询条件的字段应该创建索引
- 查询中与其它表关联的字段,外键关系建立索引
- 频繁更新的字段不适合创建索引,因为每次更新不单单是更新了记录还会更新索引,加重了IO负担
- where条件里用不到的字段不创建索引
- 单键/组合索引的选择问题,(高并发下倾向创建组合索引)
- 查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度
- 查询中统计或分组字段
六、哪些情况下不要创建索引
- 表记录太少
- 经常增删改的表:因为提高了查询速度的同时会将降低更新表的速度,如对表进行insert、update、delete。更新表时,mysql不仅仅要保存数据,还要保存一下索引文件
- 数据重复且分布平均的字段,因此应该只为最经常查询和最经常排序的数据建立索引。如果某个数据列包含许多重复的内容,为它建立索引就没有太大的实际效果