MySQL (6)_连续下标访问为什么快-CSDN博客

本文链接：https://blog.csdn.net/mu_tong_/article/details/126072555

MySQL (6)

前言：

本文内容将完成上文聚合查询中未完成的几个查询如：子查询，合并查询，然后会讲到面试常考的索引。

在此之前我们来回顾一下上文讲到过的内容：

1.表的设计

总结:

先找实体，再找关系，实体就算关键性的名词，每个实体都需要分配成一张表，然后我们还需要考虑实体与实体之间的关系不同的关系在设计表又会有不同的设计方式，如一对一，一对多，多对多。

一对一：

每个中国本土居民和他们唯一的身份证编号。

一对多

一个年级段有多个平行班级，多个平行班都隶属于一个年级段。

多对多

一个班级有若干个老师，一个老师也可以带若干个班级。

新增：和查询操作结合在一起的新增操作语法 : insert into B select * from A (将查询到 A 的记录全部插入到B 中)

注意: 这里可以通过指定列来对准需要插入的数据类型。

聚合查询：行和行之间的数据加工

聚合函数

函数说明
count( 列名 / 表达式 ) 返回查询到的数据的数量（查询结果有多少行）
sum (列名 / 表达式) 返回查询到的数据的总和，不是数字没有意义
avg (列名 / 表达式) 返回查询到的数据的平均值，不是数字没有意义
max (列名 / 表达式) 返回查询到的数据的最大值，不是数字没有意义
min (列名 / 表达式) 返回查询到的数据的最小值，不是数字没有意义

分组操作： group by 根据行的值，对数据进行分组，把值相同的行都归为一组。

此时每个组又可以分别的进行聚合查询了，分组还可以指定条件筛选，如果是分组之前指定的条件，使用where如是分组之后使用 having

联合查询（多表查询）和前面的单表查询相对应。

关键操作笛卡尔积。

函数	说明
count( 列名 / 表达式 )	返回查询到的数据的数量（查询结果有多少行）
sum (列名 / 表达式)	返回查询到的数据的总和，不是数字没有意义
avg (列名 / 表达式)	返回查询到的数据的平均值，不是数字没有意义
max (列名 / 表达式)	返回查询到的数据的最大值，不是数字没有意义
min (列名 / 表达式)	返回查询到的数据的最小值，不是数字没有意义

回忆完成下面让我们进入本文的学习，这里我们先来学习一下自连接

联合查询(多表查询)

自连接

自连接，是把自己和自己进行笛卡尔积

这里属于 SQL 中的一种奇淫巧计（使用的不多，只是用来处理一些特殊的场景的问题）。

那么这里就有一个问题啥时候需要使用自连接呢？

这里我们来了解一下自连接的本质，自连接其实是把行和行之间的比较条件转化为列和列。

回忆一下我们之间的 SQL 操作是不是通过 SQL 指定条件，按照列和列之间进行指定的。

这里拿出以前创建的 exam_result 这张表，

在这里插入图片描述

这里我们的列和列查找是不是非常好找，但是有的时候我们并不能直接进行列和列的查找，可以会是行和行

这里就来举个例子

演示：显示所有“计算机原理”成绩比“Java”成绩高的成绩信息 这里我们的问题是科目之间的分数比较这并不是针对列和列了而是针对行和行了。

1.这里我们还是拿这 4 张表来看

在这里插入图片描述

进行笛卡尔积操作，添加条件完成题目。

在这里插入图片描述

3.最后得出来的表格是不是有点不好看我们可以通过别名进行更改

在这里插入图片描述

总结：自连接的关键所在就算能把行转化成列（对自己使用笛卡尔积操作）。

子查询

这里子查询我们只需了解即可（因为面试可以会考），以后工作几乎用不到。

子查询是指嵌入在其他sql语句中的select语句，也叫嵌套查询

也就是将多个 select 合并成一个，简单来说就是套娃，他能一直套娃下去。

这里扩充一下：

人脑的内存空间是是非常小的，硬盘很大，CPU 对于返点数计算非常弱，但是对于图像意识非常强。'=

人脑同时一时刻一共能维护几个变量。据研究受过专业的训练的人大概是7个

回忆一下

Java编程中，经常谈到的“封装”，都是顺着人脑的特点来展开的。

封装的目的就是让人脑一次只关注一个点，不用考虑过多细节。

如果需要考虑细节，进入细节里面考虑，又不必考虑上层的逻辑。

java里面的一些代码太过复制的时候，就需要将其拆分成多个方法，多个类来实现。

子查询就是做着与Java 编程相反的事情：将拆分好的代码给合并成一个。

使得代码的阅读性大大降低。所以这不是一个推荐用的操作。

单行子查询：返回一行记录的子查询

演示：查找 不想毕业同学 的同班同学

这里我们就需要先知道不想毕业这个同学的班级 id 然后根据班级 id 在学生表中筛选相同班级 id 的同学

1.查找不想毕业同学的班级id

在这里插入图片描述

2.通过不想毕业同学的班级 id 在学生表找相同班级id 的同学

在这里插入图片描述

上面就是我们正常的操作流程分为两步，而子查询就需要一步下面我们来看一看。
在这里插入图片描述

别看现在这个子查询简单，如果我们套了 10个 8 个 SQL 呢你还会觉的子查询简单吗？

多行子查询：返回多行记录的子查询

有的时候子查询可能会查询出多条记录，这里就不能直接使用等号 = , 可能需要用到 in 这样的一些操作。

演示：查询语文或英文课程的成绩信息

这里我们就需要先查询语文和英语的课程 id 再根据课程id 找到对应的成绩信息。

1.查找语文或英文的课程 id

在这里插入图片描述

2.查找语文或英文的成绩

在这里插入图片描述

这我们就通过多行子查询，将这两个操作和在一起。

在这里插入图片描述

补充：

在子查询中除了能使用关键字 in , 其实能使用关键字 [not] exists

[not] exists 关键字： 这里我们的 exists 属于既执行效率低有难以理解，如果感兴趣可以自行百度了解，这里就不展开。

合并查询

合并查询：将多个查询语句的结果结合并到一起。

这里我们可以使用 union 和 union all （如果你学过 c 语言，那么肯定了解过这个 union 他就代表我们的联合体用一块内存表示不同内存的含义）

通过 union 把两个 sql 的查询结果结合合并到一起。

合并的前提是两个sql 查询的列得是对应的（如表中的没一列类型对应）。

这里就来演示一下。

查询 id 小于 3 或者名字为英文的课程

在这里插入图片描述

这里我们还可以使用 or 来完成

在这里插入图片描述

但是这里使用 or 必须保证针对同一张表指定的多个条件，但合并查询 union 不一定正对同一张表。

最后：union 和 union all 的区别是 union 会自动去重，而 union all 不会去重。

下面我们进入 MySQL 中的索引

这里我们稍微回忆一下之前的内容，可以发现，他们都是属于操作层面的，没有太大难度，封顶多表查询稍微有点难度，只要多练习一下就能掌握，

下面我们要学习 MySQL 中的索引和事物，都是属于 MySQL 原理层面的东西。

涉及到一些MySQL内部的一些实现机制，该内容比较抽象。而且 MySQL 是一个背后非常庞大的软件，内部的原理和机制，数不胜数，

（如果你的岗位是普通程序员，这些东西，很少用的到，为啥这里要学呢，单纯就是应付面试中的提问）。

索引

索引（index）相当于一本书的目录（index） 可以看到他们的英文相同这里指的是同一个东西只不过表型形式不一样

索引的概念与作用

在这里插入图片描述

索引的优缺点

这里继续拿书进行举例：

我们书的目录一旦确定了，后续每次对书的内容都可能会影响到目录的准确性，就需要重新调整目录

这里数据库的索引也是一样的，当进行增删改的时候，往往也需要同步的调整索引的结构。

这里我们来看看索引的优缺点：

索引带来的好处：提高了查找的速度。

索引带来的坏处： 1. 占用了更多的空间， 2. 拖慢了增删改 的速度。

有没有同学认为坏处有两条好处有一条，这里索引就不太好，其实

从表面来上看，似乎索引的坏处比索引带来的好处要多。但！这不必意味着弊大于利！！因为在实际需求的场景中，查询操作往往是最高频率的操作。

相对于“增删改” 的使用频率则低的可怜。因此，查询作为一个高频操作，索引对其来说是不可缺少的，

另外，有了索引之后对于查询的效率的提升使非常巨大的！！！

当MySQL里面的数据量级达到千万级别的时候（一个表里就有几千万，甚至破亿的数据）再去遍历表，就会非常非常的低效！！！

且 MySQL 在进行比较的时候不是

for(int i = 0; i< 1Kw ;i++){
	if(arr[i] == num){
		break;
	}
}

通过一个 for 循环来完成的，这个查找是在内存中的比较，而MySQL 中的比较是在硬盘上的，每次比较会涉及到硬盘上的 IO 操作，

且硬盘 IO 的速度比内存的速度慢 3 - 4 个数量级（数几万倍）。这里使用 for 循环查询就会非常非常慢

这了就有了索引操作，就能提高数几万倍的查询速度。

概念作用和优缺点了解完我们来了解了解，索引的一些 SQL 操作。

索引的一些SQL 操作

1.查看索引

语法：show index from 表名 查看一个表上都有那些索引。

在这里插入图片描述

2.创建索引

给一个表中某一列来创建索引

语法： create index 索引名字 on 表名（列名）;

注意：创建索引这件事情是非常低效的事情，尤其是当前表里面已经是有很多数据的时候。

另外：不要去贸然创建索引，别一个回车，啪嚓数据库就挂了。（这里给个忠告，我们操作数据库时一定要非常谨慎）、

3.删除索引

语法： drop index 索引名字 on 表名 ;

在这里插入图片描述

注意：这里删除索引和创建同理，都是非常低效的事情，也容易将数据库搞挂。

这里我们就需要在创建表的时候规划好（是否需要创建索引，删除索引等）。

补充：

使用 SQL 主要还是使用增删改查，虽然SQL 也支持条件，循环，变量，函数等这些编程语言普遍的机制这些操作一般很少用到。（这里我们确实需要使用这些逻辑，一般会搭配其他的编程语言，比如： java）

上面这些索引操作一般面试不考，下面让我们学习一下面试常考的，索引背后的数据结构。

索引背后的数据结构（面试考点）

索引背后的数据结构需要能够加快查找的速度，那么那些数据机构能够加快查找速度呢？

这里列举我们学习过的数据结构

顺序表
链表
二叉树（二叉搜索树）【AVL 树，红黑树（虽然还没学，这里这列举到这里）】
堆（优先队列）
哈希表

1.顺序表，链表

这里我们就要考虑使用那个才能加快查询速度呢。

这里我们的顺序表和链表坑定是不行的，这里我们的顺序表和链表都需要遍历才能查找。

注意：这里说的查找是 按照值 查找，而不是按照下标 查找 ，按照下标来访问元素，不叫查找。

补充：

这里来个问题：为啥顺序表按照下标访问的速度就快呢？

其实与内存相关，顺序表是在连续内存空间上，内存支持随机访问操作（访问任意地址上的数据，速度都是极快的并且每个数据的访问速度差不多）。

另外：

这里内存为啥支持随机访问操作，其实与内存的硬件结构（RAM 存储器的硬件结构）。

顺序表和链表不行，那么我们的二叉树（二叉树搜索）能不能提高我们的搜索效率呢？

2.二叉树（二叉搜索树，AVL树，红黑树）

我们知道二叉树搜索树的特点：左数的节点值都会小于根节点的值，右数的节点值都会大于根节点的值（子树同样满足这样的特点）。

这里我们每次查找都会少掉一半，这里就会大大的加快了我们的查找速度，这么一看我们的二叉搜索树是可以，

但是我们的二叉搜索树的时间复杂度为 0(N) [ 需要按照最坏的情况，单分子的情况下就为O(N) ]，

这里我们最坏的情况下我们的二叉搜索树就变成了一个链表。

这里我们为了避免二叉搜索树出现单分子的情况 , 这里就有了 AVL 树和红黑树，

AVL 树 就是要求比较严格的平衡二叉树，要求任意节点的左右子树高度差不超过 1 （不会出现单分子的情况，查找速度快了，基本等于二分查找）。

但是：这里我们数据库是需要进行增删查改的，而AVL 树 中，是不能随意的 增删查的，会破坏树的结构，这里增删改就会效率就会降低。

红黑树：要求比较宽松的平衡二叉树既能保证查找效率又能减少 增删改 的效率。

那么二叉树（二叉树搜索树，AVL 树，红黑树）能不能成为我们索引背后的数据结构呢？

其实是不太适合了，为什么呢？

这里当元素放入比较多的时候，我们树的高度就高了。（高度对应着比较次数），对于数据库来说，每次比较都意味着磁盘IO 。

效率快了，但树的高度难以控制（每多一次磁盘 IO 都是很伤的），所以不太适合。

二叉树都不能，那么我们的哈希表能不能作为索引结构呢？

3.哈希表

其实哈希表也不太适合，

虽然哈希表的查找速度很快 O(1) ，但哈希表只针对 相等 进行判定，不能对 大于小于，以及范围查找进行判定。

解释：哈希表存储和查找都是判断 key 值或 value 值是否存在，这里如果需要查找一个比 key值大或小的值就难以做到，

我们的哈希表是通过哈希函数来存储的，这里找大于小于 key 值的位置就难以确定。

4.堆

最后我们来看看我们的堆，我们学习堆的时候

在学习堆时我们是不是学过 topk 问题，用在找前 k 个最小或最大（通过大根堆，或小跟堆）。

可以看到我们的堆只能找最小或最大或范围查找，难以找到我们其中的某个值，所以堆也难以胜任索引背后的数据结构。

我们学习的数据结构看完，既然没有一个能做索引的，其实我们最适合做索引的还是我们的树结构，只不过不是我们的二叉树了，而是多叉树搜索树。

此时使用多叉搜索树，高度就自然就下降了。

多叉搜索树（索引背后的男人）

在这里插入图片描述

但是在数据库中使用的这个多叉搜索树，又不要太一样，是一个很特别的树成为 B+树 ( 这个是数据库索引中最常见的数据结构)。

补充：数据库有很多种，每个数据库底层又支持很多存储引擎（实现了数据具体按照啥结构来存储的程序 ,每个存储引擎存储的数据结构可能都不一样，背后的索引数据结构可能也不同)、

这里我们想要了解 B+ 树 需要先了解他的前生，B树（有的资料上也写成 B - 树 ）注意：这是B树的另外一种写法，而不是 B 减树。

B树

在这里插入图片描述

了解了 B+树的前身 B树，那么我们来了解一下 B+树，（这里 B+树只是对 B 树做出了一些改进）。

B+树

在这里插入图片描述

另外（重点）：所有数据存储（载荷）都是放到叶子节点上，非叶子节点中只保存 key 即可。因此非叶子整体占用的空间较小，甚至可以缓存到内存中！！！（这里一旦能够全放在内存当中这个时候，磁盘 IO 几乎就没了）

载荷：

在这里插入图片描述

整个数据库存储就是这个载荷（payload）。

通过上面的几点可以发现 B+ 树为数据库索引量身打造的数据结构。

这里 B 树虽然不太适合当数据库的索引，如何在其他场景下 B+树就可能没有 B树合适，这里就是你擅长这个方面就不一定擅长那个方面。

索引到此就完结了

那么面试官问你下面几道问题你能答出来吗？

面试问题

题目一：索引是干啥的

答：给信息分配一个 id ，方便在数据库快速查找该记录。

题目二：索引的使用场景

适用于数据库的查询，在海量数据中，使用索引能够大大减少查询的时间。

题目三：索引的好处去坏处

索引带来的好处：提高了查找的速度。

索引带来的坏处： 1. 占用了更多的空间， 2. 拖慢了增删改 的速度。

题目四：索引背后的数据结构

上面我们已经分析过来，这里我们只需要回答B+树和 B+树的 4个特点，

减少 IO 次数
查询结果最终都会落在叶子节点上，还是减少了 IO次数
叶子节点最后使用链表相连方便范围查找
所有数据存储（载荷）都是放到叶子节点上，非叶子节点中只保存 key 即可。因此非叶子整体占用的空间较小，甚至可以缓存到内存中！！！（这里一旦能够全放在内存当中这个时候，磁盘 IO 几乎就没了）

这里我们的索引就到此结束，下文我们将学习到另外一个面试常考 事务

MySQL (6)

文章目录

MySQL (6)

前言：

联合查询(多表查询)

自连接

子查询

单行子查询：返回一行记录的子查询

多行子查询：返回多行记录的子查询

合并查询

索引

索引 的 概念 与 作用

索引 的优缺点

索引 的 一些SQL 操作

1.查看 索引

2.创建索引

3.删除 索引

索引背后的数据结构 （面试考点）

1.顺序表 ， 链表

2.二叉树（二叉搜索树，AVL树，红黑树）

3.哈希表

4.堆

多叉搜索树 （索引背后的 男人）

B树

B+树

面试 问题

索引的概念与作用

索引的优缺点

索引的一些SQL 操作

1.查看索引

3.删除索引

索引背后的数据结构（面试考点）

1.顺序表，链表

多叉搜索树（索引背后的男人）

面试问题