目录
常见索引模型
有序数组
有序数据就很好理解了,底层就是一个数组。但缺点就是更新数据时候时间复杂度很高,最差的情况就是在数组头部插入,这样后边的所有数据都要挪动。优点就是查询非常快。
哈希表
哈希表就是以key-value存储的数据类型,利用key经过哈希函数的计算得到value的具体位置。当然,会出现哈希冲突的情况,这时候一般采用拉链法来解决。如下图所示,key1和key2经过哈希计算都等于2,这时候就会采用链表的存储方式将其存储起来。
二叉搜索树
二叉搜索树的特点就是左儿子小于父节点,父节点小于右儿子。
B+树
B+树也是InnoDB引擎采用的索引模型。因为B+树结构过于复杂,所以这里不详细赘述。主要可以理解为所有的叶子节点以有序链表的形式存储了数据。
- 有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索引,所有数据都保存在叶子节点。
- 所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接。
- 所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。
索引分类
主键类型划分:主键索引和非主键索引
主键索引的叶子节点存的是整行数据。在 InnoDB 里,主键索引也被称为聚簇索引(clustered index)。非主键索引的叶子节点内容是主键的值。在 InnoDB 里,非主键索引也被称为二级索引(secondary index)。
如下图是主键为ID,有字段k的一张表。
这里需要说明的是,主键索引跟普通索引查询的时候是不同的。
如果语句是 select * from T where ID=500,即主键查询方式,则只需要搜索 ID 这棵 B+ 树;
如果语句是 select * from T where k=5,即普通索引查询方式,则需要先搜索 k 索引树,得到 ID 的值为 500,再到 ID 索引树搜索一次。这个过程称为回表。
唯一约束划分:唯一索引和普通索引
这点内容以后单开一篇叙述
索引联合划分:联合索引和单列索引
由字面意思可知,即为单列索引和多列联合索引。
最左前缀原则
比如现在有这样一个表
CREATE TABLE `tuser` (
`id` int(11) NOT NULL,
`id_card` varchar(32) DEFAULT NULL,
`name` varchar(32) DEFAULT NULL,
`age` int(11) DEFAULT NULL,
`ismale` tinyint(1) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `id_card` (`id_card`),
KEY `name_age` (`name`,`age`)
) ENGINE=InnoDB
其中联合索引是"name_age"即name和age联合起来
那么应用最左前缀原则的话,可以这样分析。
例如查找姓名为张三的人的时候,可以定位到 ID4,然后向后遍历得到想要的结果。
内容稍有缺漏,不定期补充...