mysql索引实现原理:
为什么要使用索引?
帮助mysql高效获取数据结构 没有索引可能会异致全表扫描
mysql中索引采用的是哪些数据结构?
hash 平衡 b树 b+树 用得最多的是b b+树
hssh算法:
优点:查找可以直接根据key访问
缺点:不能进行范围查询 比大小是以hash值来比较的
index=hash(key) 通过key计算hash值得到index存放位置
因为底层数据散列的,无法进行比较大小
平衡二叉树又称AVL树(二分查找算法)
优点:平衡二叉树算法基本与二叉树查询相同,效率比较高
缺点:查询操作需要旋转,支持范围查询但是回旋效率低
平衡二叉树查询原理: cpu 内存 硬盘 1-10 查询10需要查询4次
索引文件在硬盘中
1次从硬盘中读取4(内存) 取右子树2次读8 3次取9 4次到10
比较耗时的操作是从硬盘中读取时(I/O操作) 经历4次I/O操作(树的深度)
范围查询:会回旋,1-10查询比5大的5属于最底层的左子树它需要一次向上找根节点再定位右节点的数据
如何降低树的深度来解决I/O的读取次数? B树
B树一个节点可以拥有>2个子节点 一个节点可以有2个元素
如果索引文件非常大的时候明显B树效率高于平衡二叉树
B+树:
B+树相比B树