大家都是索引,稠密索引是每条数据都存,稀疏索引是跳跃式的隔着固定一段距离再存下一个key。 稠密索引 稀疏索引 特点就是: 稀疏索引需要的空间小,占用内存也小,但是查询次数更多,速度较慢。 稠密索引占用空间大,但是查询次数更少,速度更快。 (要么空间换时间,要么时间换空间) 实际运用中: Kafka: Kafka存放segement数据段就是采用的稀疏索引,针对一个topic主题下进行的partition物理文件做分区,每个partition内部又分成多个segment,segment里面存的才是一条条message,message就是我们的记录信息。在读取的时候,通过用偏移量在指定的partition中,对应的起始位置做二分查找,不断二分,确认消费偏移量到达哪个segment。进入该segment段之后再继续找到上一次消费的位置,开始消费。 Mysql: Innodb的聚簇索引(主键)是稠密索引,非聚簇(辅助)索引是稀疏索引,所以理所当然一个表只能建立一个稠密索引,但是可以有多个稀疏索引。Innodb的主键索引是与数据存在一起的,所以通过稠密索引,找到叶子结点就可以找到目标数据。 Myisam是稀疏索引,跳跃式的索引存储,它的索引和数据行都是分开的。所以不管怎样,它都会在找到对应索引位置后进行一次回表查询。 以上是个人理解,如果有理解错误的地方可以纠正哈