学习mysql索引底层数据结构一些感悟

最新推荐文章于 2023-04-28 16:59:56 发布

CHR_YTU

最新推荐文章于 2023-04-28 16:59:56 发布

阅读量195

点赞数

文章标签：数据库

本文链接：https://blog.csdn.net/qq_44291044/article/details/100182104

版权

二叉树
红黑树（平衡二叉树）
hash
B-Tree（多路平衡二叉树）
四种数据结构做mysql各有什么优缺点
实际官方用的是B+Tree和B-Tree有什么区别？
B-Tree将data也存在了树上
B+Tree将data存在了子节点，根节点只允许16k，并且在在叶子节点做了冗余，H=3，可以支撑的索引为估算16k/14b（根节点bigint数据8b，指针6b）=1170
三层就是1170x1170x16约2000w条索引
在叶子节点也是有指针的

感悟:空间换时间,多做了冗余,加了复杂的规则,空间占用的多了,时间就会降下来.
类比于静态语言和解释型语言,在写代码的时候让人判断的多了加了一些约束的写法,性能自然会高,让机器代码自己去判断,性能自然会低.

frm文件:数据表结构的信息
MYD文件:行信息
MYI:索引 B+Tree

聚集索引:主键索引就是聚集索引(索引和文件聚集在一起)(innodb)
非聚集索引:两个文件,不放在一起

如果没有建立主键则默认给你建立一个id或者选择一个id,索引,来维护所有数据

为什么用整形自增UUID()(一长串字符串) UUID占用的空间大,要逐个比较大小很消耗资源要转换为ASCII,然后查表去比

hash表(乱序)和二叉树(有序的)
python:dict就是hashmap

在这里插入图片描述

树,二叉搜索树,图

链表和树(从链表分叉出来)

分层打印二叉树

指回去(图) 最短路径(工程上用的比较少)

链表就是特殊化的树, 树是特殊化的图

class TreeNode:
	def __init__(self, var):
		self.val = val
		self.left, self.right = None, None

二叉搜索树:左子树小于根节点的值,
右子树大于根节点

注意是所有的都是，不论第几级别的根

查询更加方便（少了一半的数据量）

从n到logn 搜索更加有效率

在这里插入图片描述
平均是logn 最坏的是n

红黑树：平衡二叉搜索树（java，c++内置的二叉树都是红黑树）

判断一个树是否是二叉排序树

在这里插入图片描述

根的位置：在左，中，右前中后

自己调用自己的就是递归：不停止的递归就会死循环，要有个退出的条件

在这里插入图片描述

递归的思想

关注