没有一堆似是而非的类比,直白明了,一看就懂。
原文地址: http://gk.link/a/11bZx
图1. 主键索引
1.叶子节点是数据页,存放完整的数据条目;非叶子节点是索引页,存放了"稀疏主键+子索引页地址"或者"稀疏主键+数据页地址"。数据页和索引页都以文件形式存放在磁盘上。
2.上述根据主键维护一棵B+树,对应就形成了主键索引;如果根据非主键维护一棵B+树,就形成了非主键索引,它的数据页存中只存放主键值和索引键值。非主键,指的就是除了主键的其他数据列,也可以用来做键。不同非主键的组合成的元组,作为B+树的排序依据,比如用name,age,sex三个数据字段做键,(tim,26,male)就是一个索引键值,这样的键值在比大小的时候具有左结合特性:(tom,26,male) > (tim,33,male), 即从最左边的tom开始比较,分出大小后就不再比较后续部分了。比如这里的tom>tim,所以整体上(tom,26,male)>(tim,33,male)。
3.值得说明的是,如果知道要查的数据的主键,总是可以优先使用主键索引,根本不需要使用非主键索引。然而细细想来,这是很难做到的。因为对于主键的要求是唯一性,不能有重复,对于海量的数据,不可能做到每个主键有实际意义而且又唯一。在必须满足唯一性的前提下,主键只能设计的很抽象,抽象的东西很难直观反映出我们要查的数据的特点,所以在查询之前我们是很难知道主键的。所以只使用主键索引,虽理论可行,但是实践完全没法实现。
uuid虽然可以做到唯一性,但是占用空间太大,影响存储效率,因为在主键索引的索引页中也要存储主键(并且uuid对人不友好,肉眼看上去难区分大小),同时在查找时需要进行字符串比大小运算,效率也不及数值型主键。所以主键一般选用int型自增id。
4. mysql建表时,如果不指定主键,mysql会自动在数据列中寻找满足唯一性条件的字段作为主键,倘若没有符合条件的字段,则会增加一个隐藏的字段做主键。(但是不推荐这么做,不要让mysql去做这些trivial琐碎的事情,只让它做那些主要的事情将有利于提高其性能)。
4. mysql 建表时默认没有生成非主键索引,所以在查询时是遍历整张表的(因为查询方不知道主键,所以全表查询),如果数据量变大,查询速度会越来越慢。