索引是存储引擎用于快速找到记录的一种数据结构。
索引的类型
- B-Tree索引
很多存储引擎(比如InnoDB)使用的是B+Tree,即每一个叶子节点都包含指向下一个叶子节点的指针,从而方便叶子节点的遍历。不通存储引擎以不同的方式使用B-Tree索引:MyISAM使用前缀压缩技术使索引更小,InnoDB按照原数据格式进行存储。MyISAM索引通过数据的物理位置引用被索引的行,InnoDB根据主键引用被索引的行。
B树索引对索引列是顺序存储的,所以很适合查找范围数据。适用于全键值、键值范围或键前缀查找(键前缀查找只适用于最左前缀的查找)。
联合索引(复合索引的一些限制):
①如果不是按照索引的最左列开始查找,则无法使用索引;
②不能跳过索引中的列;
③如果查询中有某一列的范围查询,则右边所有列都无法使用索引优化差找。
- 哈希索引
哈希索引(hash index)基于哈希表实现,只有精确匹配索引所有列的查询才有效。对于每一行数据,存储引擎都会对所有的索引列计算一个哈希码(hash code),哈希码十一个较小的值,不同键值的行计算的哈希码也不一样。哈希索引将所有哈希码存储在索引中,同时在哈希表中保存指向每个数据行的指针。
MySQL中,只有Memory引擎显式支持哈希索引,也是Memory引擎表的默认索引类型。Memory引擎支持非唯一哈希索引,多个相同哈希值的记录指针以链表的方式存放在一个哈希条目中。InnoDB用户无法手动创建哈希索引,这一层上说,InnoDB确实不支持哈希索引;但InnoDB会自调优(self-tuning),如果判定建立自适应哈希索引(Adaptive Hash Index, AHI),能够提升查询效率,InnoDB自己会建立相关哈希索引(完全自动、内部的行为,无法控制或配置,但可关闭),这一层上说,InnoDB又是支持哈希索引的。
因为索引只需春春对应的哈希值,所以索引的结构十分紧凑,这也让哈希索引查找速度非常快。
哈希索引的限制
1、哈希索引只包含哈希值和行指针,不存住字段,所以不能用索引中的值来避免读取行
2、哈希索引数据并不是按照索引值顺序存储的,所以无法用于排序
3、不支持部分索引列匹配查找,因为哈希索引始终是使用索引列的全部内容计算哈希值得
4、只支持等值比较查询,包括=、IN()、<=>(注意<>和<=>是不同操作),不支持任何范围查询。
5、哈希冲突较多时,影响查询效率,维护效率。
- 空间数据索引
MyISAM表支持空间索引,用作地理数据存储。和B-Tree索引不同,这类索引无需前缀查询。空间索引会从所有纬度来索引数据。查询是可以有效地使用任意纬度来组合查询。必须使用MySQL的GIS相关函数来维护数据。(MySQL的GIS支持并不完善,换别的库吧) - 全文索引
全文索引是一种特殊类型的索引,它查找的是文本中的关键字,而不是直接比较索引中的值和其他几类索引的匹配方式完全不一样,更类似于搜索引擎,而不是简单的where条件匹配。
全文索引和B-Tree索引并不冲突,可以同时创建。
索引的优点
- 索引大大减少了服务器需要扫描的数据量
- 索引可以帮助服务避免排序和临时表
- 索引可以将随机I/O变为顺序I/O
注:
索引并不是最好的工具。只有当索引帮助存储引擎快速查找到记录带来的好处大于其带来的额外工作时,索引才是有效的。