转载请注明出处
参考资料:《高性能Mysql》
1. 什么是索引
索引(在MySQL中也叫做“键(key)”)是存储引擎用于快速找到记录的一种数据结构。
2. 为什么要使用索引
索引对于良好的性能非常关键。尤其是当表中的数据量越来越大的时候,索引对性能的影响更加重要。
索引优化应该是对查询性能优化最有效的手段,索引能够轻易将查询性能提高好几个数量级。
3. 索引的基础
在MySQL中,存储引擎用类似的方法使用索引,其先在索引中找到对应值,然后根据匹配的索引记录找到对应的数据行。
索引可以包含一个或多个列的值。如果索引包含多个列,那么列的顺序也十分重要,因为MySQL只能高效地使用索引的最左前缀列。
4. 索引的类型
在MySQL中,索引是在存储引擎层而不是服务器层实现的。所以,并没有统一的索引标准:不同存储引擎的索引的工作方式并不一样,也不是所有的存储引擎都支持所有类型的索引。即使多个存储引擎支持同一种类型的索引,其底层的实现也可能不同。
索引 | MyISAM引擎 | InnoDB引擎 | Memory引擎 |
B-Tree索引 | 支持 | 支持 | 支持 |
HASH索引 | 不支持 | 不支持 | 支持(默认) |
R-Tree索引 | 支持 | 不支持 | 不支持 |
Full-text索引 | MySQL (5.0),仅限于CHAR、VARCHAR和TEXT列 | 暂不支持 | 不支持 |
5. 索引是如何实现的(底层数据结构)
B-Tree索引
如果没有特别指明类型,那多半说的是B-Tree索引,它使用B-Tree数据结构来存储数据。大多数MySQL引擎都支持这种索引。
底层的存储引擎也可能使用不同的存储结构。例如,NDB集群存储引擎内部实际上使用了T-Tree结构存储这种索引,即使其名字是BTREE ;InnoDB则使用的是B+Tree。
B-Tree对索引列是顺序组织存储的,所以很适合查找范围数据。B+Tree原理:
http://blog.csdn.net/u013235478/article/details/50625677
哈希索引
底层实现原理:哈希索引(Hashindex)基于哈希表实现,只有精确匹配索引所有列的查询才有效。
6. 使用限制
使用B-Tree索引的限制:
(1) 如果不是按照索引的最左列开始查找,则无法使用索引。
(2) 不能跳过索引中的列。
(3) 如果查询中有某个列的范围查询,则其右边所有列都无法使用索引优化查询。
使用哈希索引的限制:
(1) 哈希索引只包含哈希值和行指针,而不存储字段值,所以不能使用索引中的值来避免读取行。
(2) 哈希索引数据并不是按照索引值顺序存储的,所以也就无法用于排序。
(3) 哈希索引也不支持部分索引列匹配查找,因为哈希索引始终是使用索引列的全部内容来计算哈希值的。
(4) 哈希索引只支持等值比较查询,包括=、IN()、<=>。也不支持任何范围查询
(5) 当出现哈希冲突的时候,存储引擎必须遍历链表中的所有行指针,逐行进行比较,直到找到所有符合条件的行。
(6) 如果哈希冲突很多的话,一些索引维护操作的代价也会很高。