B-Tree索引可能碎片化,会降低查询的效率。碎片化的索引可能以很差或者无序的方式存储在磁盘上。根据设计,B-Tree需要随机磁盘访问才能定位到叶子页,所以随机访问是不可避免的。如果叶子页在物理分布上是顺序且紧密的,那么查询的性能就会更好。否则,对于范围查询、索引覆盖扫描等操作来说,速度可能会降低很多倍,对于索引覆盖扫描更加明显。
表的数据可能碎片化,数据存储的碎片化比索引更复杂。
有三种类型的数据碎片:
1. 行碎片
这种碎片指的是数据行被存储为多个地方的多个片段中,即使查询只从索引中访问一行记录,行碎片也会导致性能下降。
2. 行间碎片
行间碎片是指的是逻辑上顺序的页,或者行在磁盘上面不是顺序存储的。
3. 剩余空间碎片
剩余空间碎片指的是数据页面有大量的空余空间,会导致服务器读取大量不需要的数据,造成浪费。
在选择索引和编写利用索引查询的时候有三大原则:
1.单行访问是很慢的。特别在机械硬盘存储中的随机I/O要快的很多。
2.按顺序访问数据是很快,顺序I/O不需要多次磁盘寻道,所以比随机I/O快的很多,如果服务器能够按照需要顺序读取数据,就不再需要额外的排序操作,GROUP BY查询也不需要排序和按行按组进行聚合计算。
3.索引覆盖查询是很快的。如果一个索引包含了查询所需要的所有列,那么存储引擎就不需要在回表查找行。