目录
索引模型
哈希表
用哈希函数把key转换成确定的位置
问题:哈希函数算出的位置相同怎么处理
解决:相同位置下还有一个链表,没有顺序(插入方便,查询费事)
有序数组
用身份证做索引有序排列吗?
搜索树
二叉树(100w节点,树高20,一次可能要访问20个数据块(都是在磁盘里,所以效率很低)),n叉树更好一点。
索引
B+树的操作,合并和分裂
最好不用身份证做主键(其它索引关联太长了),一旦主键索引太长,所有索引的叶子节点都会变大
索引组织表:表根据主键顺序以索引的形式存放
回表:回到主键索引树搜索的过程
普通索引
普通索引的查询方式是什么?
change buffer
唯一索引
由于需要判断插入数据是否重复,需要把数据读入缓存,所以不用change buffer
覆盖索引
原理:查询的值就是主键索引,在自己的索引树上就能查到最终结果
联合索引建立评估原则:尽量做到可以少维护一个索引,如果两个字段都有在用索引,用空间大的那个,减少索引空间
联合索引使用时会用最左原则
mysql5.6以上,索引下推优化(如果sql条件有两个字段判断,会将两个字段都定位到,再去找主键索引)
字段加索引
可以给字段的部分加索引 add index index2(email(6)),到主键索引查找的次数算扫描行数
定义好行数既可以省空间,又不增加查询
使用 select count(distinict left(email,4)) as L4 来当做区分度
用不上覆盖索引了
像身份证,可以将身份证倒过来进行存储。区分度就变大了,或者使用hash身份证得到一个校验码
不支持范围查询,只支持等值查询
倒叙储存:存的时候就是倒序的,建索引拿前面几位,匹配的时候也算出后面几位的倒叙再匹配
hash字段
区分度=总数量/不同的数量
倒序存储