MySQL的索引和事务

最新推荐文章于 2024-09-06 13:14:04 发布

小比特鹏

最新推荐文章于 2024-09-06 13:14:04 发布

阅读量664

点赞数 28

文章标签： mysql 数据库索引事务

本文链接：https://blog.csdn.net/m0_74173529/article/details/137408111

版权

索引

索引的概念

那索引是啥呢?
类似于目录也是一种特殊的文件,能够提高查询的速度,但也会占用更多的空间,也可以会减慢增删查改的速度. 在数据库中索引可以分为很多种类型,比如B树索引哈希索引、位图索引等等。每种索引类型适用于不同类型的数据和查询优化。比如：B树索引适用于范围查询和顺序访问；哈希索引则适用等值查询和快速访问。

索引的意义

索引最大的意义就是在于提高数据访问的效率。打个比方如果我们现在想要查找一个特定的数据项，我们要遍历整个数据集合这样的查询是十分低效的；但我们有了索引之后，就可以直接通过索引定位到数据的位置，这样就大幅度提高了查找的效率。

索引的使用

我们了解索引之后，该如何使用索引呢
1、查看索引 show index from 表名
2、创建索引 create index 索引名 on 表名（列名）
3、删除索引 drop index 索引名 on 表名
在这里我们需要注意的是删除索引的操作也是一个非常危险的操作这里的操作都会涉及到大量的IO操作，就很有可能把MySQL主机给搞挂了。

索引底层的数据结构

那索引背后的数据结构是什么呢二叉树吗还是其他的
用来查询对比数据结构其实有很多包括二叉搜索树（红黑树）、哈希表

红黑树并不适用于大量的大规模的硬盘上管理数据的场景。为什么呢
**原因：**红黑树是二叉搜索树，当元素很多的时候，就会让树的高度变得比较高，树的高度越高进行查询的速度就会越低比如说你在中序遍历找到下一个后继节点这样的操作，很有可能要往父节点上进行一系列回溯，才能够找到该节点高度每增加一层，比较次数就加1 比较操作就会需要一次IO操作了。

哈希表也不行虽然哈希表每次查找的速度都是O（1），但哈希表只能查找相等的相等的才能进行判断不能判断其他情况不能进行范围查找。

总的来说，最适合做索引的还得是树型结构你想想红黑树是因为树的高度为高了就会降低查找的速度那我们如果让树多分几个叉出来那树的高度不就自然而然的下降了吗。所以我们可以引入‘多叉搜索时’ 这样的数据结构就是 B+树。

要想了解B+树我们先了解一下B树本质上是一个N叉搜索树。
每个节点上可以存储多个元素，延申出多个字数。
表示同样数量的数据，需要的节点就少了，对应的树的高度也就大幅度降低了。
在这里插入图片描述
如上图这就是B树的基本模型。

在这里拿着一个key在某个节点比较的时候，确实也是需要更多的次数也不是一次比较就完成的但是这里的比较还是有说法的。
1、每个节点上的key都是有序排列的，比较的时候可以使用二分查找。
2、B树也会控制，某个节点上保存的key不会太多
3、多个数据，都是放在一块存储空间上的，进行比较的时候，一次硬盘IO操作就能读出整个节点。虽然有多次比较但只进行一次硬盘IO。

那B+树是怎么样的呢
其实B+树就是B树的升级版
在这里插入图片描述
B+树，会把叶子节点通过类似于链表这样的链式结构串起来，此时就可以通过上诉链式结构非常方便的遍历整个表中的所有数据了。

B+ 树相对于B树的优势在哪呢
1、非常方便进行遍历和范围查询
2、当前任何一次查询操作，最终都会落到叶子节点完成的，查询任何数据经历的IO操作都是一样的这个时候，查询操作消耗的时间是非常稳定的。
3、由于叶子节点，是数据的全几，对应的，非叶子节点中，都是重复出现的数据；就可以把表每一行的数据，最终关联到叶子节点这一层，非叶子节点中只保存一个单纯的key值即可。

而且B+树这个结构会一直存在的，如果你定义了主键，自然索引就按照主键来建立，如果没定义主键，会有自带的隐藏的列建立。

事务

概念

事务就是为了把多个独立的操作打包成一个整体。
在日常开发中，很多操作，不是通过一个SQL 就可以完成的，往往需要多个SQL配合完成。当执行多个SQl操作的时候，如果中间出现了特殊的情况（网络断开、系统崩溃等等）可能会导致前面的SQL执行完成了但是后面的SQL执行失败了。
会出现什么场景呢就会有你给我转账你的钱减少了但是我的钱并没有增加这种转账丢失的情况是十分严重的涉及到财产安全问题.

事务的特性

原子性

原子性是指事务是一个不可分割的工作单位，事务的操作要么全部成功，要么就失败。事务中的若干个sql是一条一条执行的，事务可以保证当执行到哪一条出现问题时，数据库就会自动回滚到到一开始重新执行一次。

一致性

一致性是数据库执行事务之前和执行事务之后保证数据是一致的不会出现对不上的情况。这也和回滚机制有关一旦触发回滚机制回来回滚回去的数据都是正确的没有触发回滚机制数据也是正确的。

持久性

持久性是指一旦事务提交，则事务所做的修改就会永久保存到数据库中，即使发生故障网络断开、系统崩溃数据也不会丢失。

隔离性

隔离性是指当一个事务执行的时候不受其他并发事务的影响就类似多个客户端同时给服务器发起事务系统就应该确保该事务和其他事务隔离起来，防止造成冲突。

上面事务的四个特性共同保证了数据库的稳定性和可靠性能让数据库在并发环境下稳定运行。

并发执行事务会带来的问题

脏读问题

脏读问题就是说现在有事务A和事务B 事务A现在针对某个表做出了一些修改，在事务A提交之前，事务B就对这里的数据进行了读取，最终就可能出现A后续的操作又把上面的数据进行了修改导致B读到的数据和A提交的数据是不一样的。

举个例子：
假如我在备课，在写一些代码，就有些同学路过的时候，偷偷的瞄了一眼我的屏幕，看到了我写的代码，偷偷的记下来。我虽然是写了这些代码但是可能在同学看完，走了之后，我把代码修改了最终可能我上课的时候的代码和同学瞄的代码是不一样的。这时该同学就读到了一个“临时数据” 这个临时数据也被称为脏数据

那该怎么解决脏读问题呢？
可以针对“写操作”进行加锁，我在写的时候就不能进行读写完了才能读
就相当于并发执行的时候事务A和事务B是可以同时执行的，现在引入了写加锁之后，执行A的过程，B就不能执行了要等待A执行完。
这样就降低了‘并发能力’，提高了隔离性，提高了数据的准确性。

不可重复读问题

如果一个事务中有多个读的操作，多次读操作读出来的结果不一致。

就相当于现在有三个事务ABC
事务A针对数据进行修改提交，接下来事务B进行读取操作这里事务B多个SQL都要进行读操作在执行B的过程中有个C事务又针对数据进行了修改，就会让B里面的不同读操作，读出来的结果是不一样的。
那该如何解决不可重复读操作呢
给读操作也加锁 我写的时候别人也不能读，别人读的时候我也不能写。这样我们引入了读操作的加锁就会让并发性又下降了 ‘隔离性’又进一步的提高了。