联合索引
- 两个或更多个列上的索引被称作联合索引。联合索引底层使用的是B+树索引(只有一棵树),排序时它首先按照第一个索引排序,在第一个索引相同的情况下,再按第二个索引排序,依次类推。
- 在mysql建立联合索引时会遵循最左前缀匹配的原则,即最左优先,在检索数据时从联合索引的最左边开始匹配,因为右边的索引都是在左边的索引排序的基础上进行排序的,如果没有左边的索引,单独看右边的索引,其实是无序的。例如索引是key index (a,b,c). 可以支持a | a,b| a,b,c 3种组合进行查找,但不支持 b,c进行查找 。(当最左侧字段是常量引用时,索引就十分有效)
最左匹配规则
以最左边的为起点,任何连续的索引都能匹配上。同时遇到范围查询(>、<、between、like)就会停止匹配。
为什么要使用联合索引
- 减少开销。建一个联合索引(col1,col2,col3),实际相当于建了(col1),(col1,col2),(col1,col2,col3)三个索引。每多一个索引,都会增加写操作的开销和磁盘空间的开销。对于大量数据的表,使用联合索引会大大的减少开销!
- 效率高。索引列越多,通过索引筛选出的数据越少。有1000W条数据的表,有如下sql:select from table where col1=1 and col2=2 and col3=3,假设假设每个条件可以筛选出10%的数据,如果只有单值索引,那么通过该索引能筛选出1000W10%=100w条数据,然后再回表从100w条数据中找到符合col2=2 and col3= 3的数据,然后再排序,再分页;如果是联合索引,通过索引筛选出1000w10% 10% *10%=1w,效率提升可想而知!
- 覆盖索引。对联合索引(col1,col2,col3),如果有如下的sql: select col1,col2,col3 from test where col1=1 and col2=2。那么MySQL可以直接通过遍历索引取得数据,而无需回表,这减少了很多的随机io操作。减少io操作,特别的随机io其实是dba主要的优化策略。所以,在真正的实际应用中,覆盖索引是主要的提升性能的优化手段之一。
例题:
select * from table where a = xxx and b = xxx;占60%
select b from table where b = xxx; 占39%
其他占1%。怎么优化?
解答:将第一条sql语句改为 select * from table where b = xxx and a = xxx ,然后建立ba的联合索引,因为ba的联合索引可以支持b和ba这两种组合的查找,这样就减少了开销
覆盖索引
- 定义:当索引上包含了查询语句中的所有列时,我们无需进行回表查询就能拿到所有的请求数据,因此速度会很快。
- 当explain的输出结果Extra字段为Using index时,则代表触发覆盖索引。