Mysql底层与优化
数据的存储、磁盘IO与索引
- mysql 数据以记录为单位,离散地存储在硬盘上,我们依靠存储地址来找到记录
- 很多时候我们没办法直接找到想要的数据。因为通常我们的需求形如:找的学号为2016060666的学生的记录;而不是:找到磁盘中以0x00123456位置开头的记录
- 这时我们对所有记录进行轮询,依次访问每一条记录的学号是不是我们要查找的学号,这样的查找效率极低
- 磁盘IO是非常耗时的操作,因为每访问一个数据就要做一次磁盘IO,一次磁盘IO包括磁头寻道和等待扇区
- 解决办法就是让磁盘在做少次的IO后找到我们要的记录,将查找条件和记录地址建立联系,在不同场景下建立有利于查找的数据结构,如二叉树、HashMap等
- 能够帮助我们高效查找数据的数据结构就是索引,索引能够提高查找效率,但是减低写效率
索引结构
二叉树(红黑树/AVL)
- 利用二分查找树或红黑平衡树可以快速找到我们要找的元素,但是对于数据库来说,表的记录往往是会不断增长的,即树的结构收到数据和插入次序的影响,此时得到的树不理想
- 可以看出要想的到一颗理想的二叉树,那么索引值和插入次序条件将会十分苛刻,绝大部分场景下等不到接近理想的二叉树
- 红黑树/二叉平衡树情况比二叉树好一些,但是数据规模大的时候,树的深度会很大,意味着依然需要做很多次磁盘IO,效果依然不理想
HashMap
HashMap一次查找的时间复杂度是O(1),但是只能做等值查询,做不到范围查询,在很多场景下依然不适用
BTree
- 针对减小树的深度,我们可以对树的节点做横向扩容,每个节点可以存储多个数据&