索引:类似书的目录,方便定位想要查找的内容。是帮助数据库更高效的查询所排好序的数据结构。
索引的数据结构
二叉树:
最基本的树,有一个根节点,左边的节点永远小于右边的节点
红黑树:
也叫二叉平衡树,二叉树的变种,节点分为黑色和红色,根节点和叶子节点为黑色,每个红色节点的两个子节点也是黑色,有连续的两个红色节点就做一次平衡。
B树
B树在红黑树基础上改造,把节点横向扩展,每个节点存放多个索引,索引不重复,非叶子节点存放指针,指向叶子节点,叶子节点没有指针。(data为内存地址)
B+树
B+树在B树的基础上改造,B树在每个节点存储了索引和数据的内存地址(上图中data),B+树只在最底层的叶子节点存放内存地址(所有的内存地址都存储在叶子节点,非叶子节点只做索引,有重复),所以B+树每个叶子节点可以存放的索引更多。
==MySQL中每个节点可以存储16KB,设索引(15,56,77)为bigint类型,每个索引在内存占8B空间,
索引间的指针(星星标记的位置)存放指向节点的内存地址,MySQL规定为6B,这样存储一个索引占14B,一个非叶子节点大概可以存储1140个索引,==叶子节点没有存放指针,存放的是索引所在行的所有数据合集(一行数据)假设为1KB,一个叶子节点可以存放16个索引,这样树高为3就可以存放1140114016个索引。
hash表
hash是对索引列做hash运算后,把散列值和内存地址存放在hash表中,只做一次hash运算就可以定位数据(hash只能做等于,无法做范围查找大于小于,用的少)