索引(Index)
含义: 索引 是帮助 MYSQL 高效获取数据的数据结构。 索引是一种数据结构。
索引 :** 排好序的快速查找数据结构。**
在数据之外,数据库系统还维护者满足特点查找算法的数据结构,这些数据结构以某种方式引用(指向) 数据。这样就可以在这些数据结构的基础上实现高级查找算法,这种数据结构就是索引。 BTree
一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以文件的形式存储的磁盘上
我们平常所说的索引,如果没有特别指明,一般都是指 B 树(多路搜索树,并不一定是二叉)结构组织的索引
,其中聚集索引,次要索引,覆盖索引,复合索引,前缀索引,唯一索引默认都是使用 B+ 索引
,当然除了 B+树
这种索引之外,还有哈希索引(hash index)
这样子就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。
索引的目的在于提高查找效率。
** 优势:**
- 类似于大学图书馆建数目索引,提高数据检索的效率。降低数据库的IO成本
- 通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗
**劣势: **
- 实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引列也是要占用空间的
- 虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行了
INSERT, UPDATE 和 DELETE
,因为更新表时,Mysql 不仅要保存数据,还要保存以下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息 - 索引只是提高效率的一个因素,如果你的Mysql 中有大数据量的表,就需要花时间研究建立最优秀的索引,或者优化查询。
Mysql的索引分类
- 单值索引: 即一个索引只包含单个列,一个表可以有多个单列索引
- 唯一索引: 索引列的值必须唯一,但允许有空值
- 符合索引: 即一个索引包含多个列
** 基本语法 **
创建:
1. CREATE [UNIQUE] INDEX indexName ON TABLE_A columnname(length)
2. ALTER TABLE_B ADD [UNIQUE] INDEX [indexname] ON (columnname(length))
删除:
DROP INDEX [indexname] ON TABLE_A;
查看:
SHOW INDEX FROM TABLE_A\G;
有四种方式来添加数据表的索引。
ALTER TABLE tbl_name ADD PRIMARY KEY(column_list); # 该语句添加一个主键,这意味着索引值必须是唯一的,且不能为NULL
ALTER TABLE tbl_name ADD UNIQUE index_name(column_list); # 这条语句创建索引的值必须时唯一的。 NULL 除外,并且NULL 可以出现多次
ALTER TABLE tbl_name ADD INDEX index_name(column_list); # 添加普通索引,索引值可以出现多次
ALTER TABLE tbl_name ADD FULL TEXT index_name(column_list); # 该语句制定了索引为 FULLTEXT,用于全文索引。
MYSQL 索引结构
BTree索引:
什么情况下需要做索引
- 主键自动建立唯一索引
- 频繁作为查询条件的字段应该创建索引
- 查询中与其他表关联的字段,外键关系建立索引
- 频繁更新的字段不适合创建索引,因为每次更新不单单更新了记录还会更新索引
- where 条件里用不到的字段不创建索引、
- 单键/组合索引的选择问题, 高并发情况下倾向组合索引
- 查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度
- 查询中统计或者分组字段
哪些情况不需要创建索引
- 表记录太少
- 经常增删改的表(提高了查询速度,同时降低了更新表的速度,如对表进行
INSERT,UPDATE,DELETE
因为更新表的时候,不仅要维护数据,还要维护索引文件) - 数据重复且分布平均的表字段,因此应该只为最近常查询和最经常排序的数据列建立索引。(注意: 如果某个数据列包含许多重复的内容,为它建立索引就没有太大的实际效果)