组合索引原理:
-
索引结构:
在Oracle数据库中,组合索引类似于一个多级目录结构,其中每个级别代表索引中的一个列。例如,创建一个组合索引(col1, col2, col3)
,意味着索引首先是按照col1
的值排序,对于每个col1
值相同的行,再按照col2
排序,最后在col2
值相同的情况下,根据col3
进行排序。 -
最左前缀原则:
组合索引遵循最左前缀匹配原则,即查询只能从索引最左边的列开始匹配。也就是说,如果存在组合索引(col1, col2, col3)
,那么查询条件中必须至少包含col1
,才能有效利用此索引。如果查询只涉及col2
或col3
,则不会直接使用此组合索引,除非Oracle的优化器通过索引跳跃扫描或其他优化策略判断这种方式更高效。 -
索引跳跃扫描(Index Skip Scan):
自Oracle 9i以后,优化器在某些情况下可以使用索引跳跃扫描的方式,即使查询条件没有包含组合索引的第一个列,也能间接利用索引。但这是基于成本计算的结果,只有当使用这种方式的成本低于其他扫描方式时才会发生。 -
覆盖索引:
若查询所需的全部列都在组合索引中,那么Oracle可以直接通过索引返回结果而不必回表,这称为“索引覆盖查询”。例如,如果查询仅要求col1
和col2
的值,并且有一个索引(col1, col2, col3)
,那么Oracle可以仅通过索引完成查询,极大地减少了I/O开销。
应用场景与优化策略:
-
场景选择:
针对那些经常在联合作用下进行筛选的列创建组合索引,如经常执行SELECT * FROM table WHERE col1 = ? AND col2 = ?
这样的查询。 -
索引顺序:
确保组合索引中最左侧的列是高选择性的列,也就是那些能较好地区分行的列。选择性越高,索引的效果越好。 -
避免函数索引:
在组合索引中尽量不要包含在查询中被函数运算的列,因为这通常会阻止Oracle直接使用索引。 -
查询优化:
根据组合索引的顺序调整查询语句中的条件表达式,使得优化器更容易识别并使用索引。 -
统计信息:
维护正确的表和索引统计信息,确保优化器能准确地估计查询成本并选择最优的执行计划。