我们知道,MyISAM索引文件和数据文件是分离的,索引文件仅仅保存了数据记录的地址。
在InnoDB中,数据文件本身就是索引文件,表文件本身就是一个按照B+树组织的一个索引结构,叶节点data保存了完整的数据记录,这个索引的key是数据表的主键,因此InnoDB表数据文件本身就是主索引。
上图是InnoDB数据文件(主索引)的示意图,叶节点包含了所有的数据内容,这种告诉索引也叫做聚集索引。因为InnoDB本身按照主键聚集,所以如果我们在定义表结构的时候没有定义主键,InnoDB会为该表自动生成一个大小为6个字节的不会重复的值作为主索引的key。
InnoDB的副索引中叶子节点只存放了主索引的数据记录的key值而不是地址,换句话说,InnoDB的所有辅助索引都引用主键作为data域
了解不同存储引擎的索引实现方式对于正确使用和优化索引都非常有帮助,例如知道了InnoDB的索引实现后,就很容易明白为什么不建议使用过长的字段作为主键,因为所有辅助索引都引用主索引,过长的主索引会令辅助索引变得过大。再例如,用非单调的字段作为主键在InnoDB中不是个好主意,因为InnoDB数据文件本身是一颗B+Tree,非单调的主键会造成在插入新记录时数据文件为了维持B+Tree的特性而频繁的分裂调整,十分低效,而使用自增字段作为主键则是一个很好的选择。