- 索引是帮助Mysql高效活的数据的排好序的数据结构
- 索引数据结构
-
二叉树:特点:左边的叶子节点<父根节点<右边叶子节点,二叉树对递增的一列索引没有明显性能提升效果
-
红黑树:右边比左边大的时候,增加索引会在右边节点进行调整(二叉平衡树),数据量大的时候树的高度太高,所以也不是数据索引的最优选择
-
Hash表:
- 对索引的key进行一次hash计算就可以定位出数据存储的位置
- 很多时候Hash效率比B+tree索引更高效
- 仅能满足 “=” “in”,不支持范围查询
- hash冲突问题
-
B-Tree:
- 一行放更多的索引元素(增加数据叶,data放到这里),减少了树的高度
- 叶节点具有相同的高度,叶节点的指针为空;所有索引元素不重复;
- 节点中的数据索引从左到右递增排列
-
B+Tree(B-Tree的变种):
- 非叶子节点不存储data,只存储索引(冗余),可以放更多的索引;
- 叶子节点包含所有索引字段;
- 叶子节点用指针连接,提高区间访问的性能;
-
B+树的高度(影响查找效率)取决于非叶子节点可以放多少索引
B树的高度取决于叶子节点可以放多少索引+data(高度更高)
搜索引擎:
innodb(聚集索引):frm表结构 ibd 数据和索引
表数据文件本身就是按照B+树组织的一个索引结构文件
聚集索引-叶节点包含的了完整的数据记录
为什么建议InnoDB表必须建主键,并且推荐使用整数型的自增主键:要有一列所有数据都不相等的一列(索引数据)组建B+树,数据库资源很宝贵,挑一列做索引或者加隐藏列索引耗费资源。整型比较大小快,效率高
myisam(非聚集索引):3个文件 frm数据表结构 MYD数据 MYI索引