1.索引概述
索引是一种高效获取数据的排好序的数据结构。
几千条以下推荐全表扫描。
- 优势
提高数据检索的效率,降低数据库的IO成本
通过索引列对数据进行排序,降低数据排序的成本 - 缺点
索引会占据磁盘空间
会降低更新表的效率。比如每次对表进行增删改操作,MySQL不仅要保存数据,还有保存或者更新对应的索引文件。
2.索引的底层结构选择
MySql索引的底层结构是B+树。
2.1哈希
Hash 又称散列,是一种广义的算法,即一种思想。比如对一系列数字 对10取模 即得到其存储的索引。
哈希碰撞:对不同的关键字可能得到同一散列地址,即key1≠key2,而f(key1)=f(key2),这种现象称碰撞。
解决哈希碰撞:
1.开放寻址法:线性开型寻址散列是一种处理散列碰撞的方法,当发生碰撞时,线性探测法检查散列表中的下一个位置是否为空。如果为空,就将数据存入该位置;如果不为空,则继续检查下一个位置,直到找到一个空的位置为止。 当碰撞严重时 ,很有可能变成线性遍历。
2.数组+链表
索引不适用哈希的原因:要将数据文件添加到内存,耗费空间;如果是等值查询(where id = 1)效率的确很快 但很多时候是范围查询,Hash不支持范围查询。
2.2二叉查找树
对应的是二分查找法。以根节点为中心,左边的都比他小,右边的都比他大。时间复杂度为logN.
但可能存在极端情况,此时退化为链表 复杂度为N.