shu据库常见结构面试题（InnoDB和索引B+Tree）

Tronhon

已于 2023-10-08 18:22:16 修改

阅读量38

点赞数

分类专栏：程序员笔试面试文章标签：面试 shu据库

于 2019-08-08 14:31:35 首次发布

本文链接：https://blog.csdn.net/qq_39213969/article/details/88959918

版权

程序员笔试面试专栏收录该内容

20 篇文章 1 订阅

订阅专栏

一，InnoDB数据库存储引擎

1.要查看自己的数据库使用哪种引擎（sql语句）

show variables like ‘storage_engine’;

2.InnoDB引擎与Myisam引擎存储一张表的区别。

（1）存储一张表的差别：innodb（整体使用一个主键聚集索引的，叶子结点直接存储数据库相关数据的结构，注意：如果表的主键是类似于UUID一样随机生成的字符串，那么插入B+树就是无序的，这对于B+树的结构整体是不良好的。如果主键是自增的数字就比较好，只需要在存储结构的尾节点加入数据就可以了，比较方便）
（2）myisam引擎（有三个文件组成：定义文件，数据文件，索引文件）

3.InnoDB引擎与Myisam引擎存储索引的区别。（第一个重大区别是InnoDB的数据文件本身就是索引文件，从上文知道，MyISAM索引文件和数据文件是分离的，索引文件仅保存数据记录的地址。）。。。（所以InnoDB要求表必须有主键（MyISAM可以没有），，第二个与MyISAM索引的不同是InnoDB的辅助索引data域存储相应记录主键的值而不是地址。换句话说，InnoDB的所有辅助索引都引用主键作为data域）
（1）innodb：innodb存储表就是通过一个大的聚集索引建立的，这个聚集索引有主键聚集产生。聚集索引就是一个B+树的结构，B+树的叶子结点直接存储的就是数据库的相关数据。除此之外，其他属性的索引都是二级索引，二级索引的B+树结构的叶子结点存储的就是主键的信息。一般我们通过索引检索信息都是通过两次检索B+树的过程。首次就是通过二级索引检索B+树搜索出主键信息，，然后根据主键信息通过聚集索引找出相应的表的数值信息。

（2）myisam引擎：myisam引擎就是通过一个大的非聚集索引存储信息的，聚集索引也是一个B+树的结构，但是B+树的叶子结点存储的信息是数据记录的地址。Myisam索引中，主索引和辅助索引没有什么大的区别，唯一的区别就是主索引要求key的值是唯一的，而副主索引不一定唯一。而且Myisam索引可以没有主键，innodb必须要有主键。然后主索引和副主索引查找相关关数据的索引检索算法都是根据B+输的算法索引，如果指定的key存在，则就去除data雨中的数据记录地址，根据数据记录地址，读取相应的数据记录。

3.组合索引：最左前缀原理与相关优化

高效使用索引的首要条件是知道什么样的查询会使用到索引，这个问题和B+Tree中的“最左前缀原理”有关。

这里先说一下联合索引的概念。在上文中，我们都是假设索引只引用了单个的列，实际上，MySQL中的索引可以以一定顺序引用多个列，这种索引叫做联合索引，一般的，一个联合索引是一个有序元组<a1, a2, …, an>，其中各个元素均为数据表的一列。另外，单列索引可以看成联合索引元素数为1的特例。

4.索引的存储方式（分类）：

索引是在MySQL的存储引擎层中实现的，而不是在服务层实现的。所以各种存储引擎支持的索引并不相同，MySQL目前提供了以下4种索引。

B-Tree 索引：最常见的索引类型，大部分引擎都支持B树索引。
HASH 索引：只有Memory引擎支持，使用场景简单。
R-Tree 索引(空间索引)：空间索引是MyISAM的一种特殊索引类型，主要用于地理空间数据类型。
Full-text (全文索引)：全文索引也是MyISAM的一种特殊索引类型，主要用于全文索引，InnoDB从MySQL5.6版本提供对全文索引的支持。

6.2 索引优化策略

场景

最左匹配原则、主键外、关键字where、on、groupby、orderby、区分度高、较小的数据列使用索引、索引不参与计算、
较长的字符串要建立索引、尽量扩展索引如a到a，b、不要过多创建索引、li%使用到索引（走索引）。

最左前缀匹配原则，上面讲到了
主键外检一定要建索引
对 where,on,group by,order by 中出现的列使用索引
尽量选择区分度高的列作为索引,区分度的公式是count(distinct col)/count(*)，表示字段不重复的比例，比例越大我们扫描的记录数越少，唯一键的区分度是1，而一些状态、性别字段可能在大数据面前区分度就是0
对较小的数据列使用索引,这样会使索引文件更小,同时内存中也可以装载更多的索引键
索引列不能参与计算，保持列“干净”，比如from_unixtime(create_time) = ’2014-05-29’就不能使用到索引，原因很简单，b+树中存的都是数据表中的字段值，但进行检索时，需要把所有元素都应用函数才能比较，显然成本太大。所以语句应该写成create_time = unix_timestamp(’2014-05-29’);
为较长的字符串使用前缀索引
尽量的扩展索引，不要新建索引。比如表中已经有a的索引，现在要加(a,b)的索引，那么只需要修改原来的索引即可
不要过多创建索引, 权衡索引个数与DML之间关系，DML也就是插入、删除数据操作。这里需要权衡一个问题，建立索引的目的是为了提高查询效率的，但建立的索引过多，会影响插入、删除数据的速度，因为我们修改的表数据，索引也需要进行调整重建
对于like查询，”%”不要放在前面。
SELECT * FROMhoudunwangWHEREunameLIKE’后盾%’ – 走索引
SELECT * FROMhoudunwangWHEREunameLIKE “%后盾%” – 不走索引
查询where条件数据类型不匹配也无法使用索引
字符串与数字比较不使用索引;
CREATE TABLEa(achar(10));
EXPLAIN SELECT * FROMaWHEREa=“1” – 走索引
EXPLAIN SELECT * FROM a WHERE a=1 – 不走索引
正则表达式不使用索引,这应该很好理解,所以为什么在SQL中很难看到regexp关键字的原因

5.B+树与B树的区别：分析叶子结点以及非叶子结点的结构，得出区别。

B+tree就是B-tree的改进版本。B-tree在每个节点都可以保存数据（键值对），而B+tree只有在叶子节点才可以存储数据。上图为一个B+tree。不同于B-tree在每个节点都可以存储键值对，B+tree只在叶子节点存储键值对，在其他内部节点只存储键值。如图所示，在父节点也在其叶子节点中。这是因为只有叶子节点保存数据。并且每个叶子节点和其相邻的节点处也有连接，在某些情况下，可以加快搜索速度。

6.B+树与二叉树的区别：B+树是平衡多路查找树，二叉树只有两路。叶子结点非叶子节点存储结构差别。

7.索引在B+树上怎么存储，存放的。

Innodb引擎存储表就是通过一个大的聚集索引进行存储的，该索引通过主键建立，这个大的聚集索引结构就是B+树，B+树的每个叶子结点存储的是相关表的数据。除此之外，其他数据索引采用二级索引也就是辅助索引，辅助索引的叶子结点存储的是主键。一般查找的过程就是首先通过二级索引查找出来主键，然后在根据聚集索引找到相关的数据。

8.二级索引（辅助索引）：

在B+树中辅助索引的叶子结点就是主键，非主键属性查询表信息都是通过二级索引进行查询的，首先通过二级索引查找出主键，然后根据逐渐痛过聚集索引查询得到相关的数据信息。

8.一条sql语句在mysql中的执行过程

在这里插入图片描述

9.InnoDB怎么实现rollback事务回滚功能。

我使用的是innoDB引擎，比起myisam引擎，它锁的粒度更小。myisam在事务中锁表，innoDB锁行，并且在每行数据都加入两个列记录该行的最后修改时间和删除时间。在事务中，获取类似于快照的，操作行的数据，然后进行一系列操作。如果事务正常结束就写回表，如果发生异常就不回写。

10.数据库的主从同步。

（1）通过设置主从数据库实现读写分离，主数据库负责“写操作”，从数据库负责“读操作”，根据压力情况，从数据库可以部署多个提高“读”的速度，借此来提高系统总体的性能。
基础知识
（2）要实现读写分离，就要解决主从数据库数据同步的问题,在主数据库写入数据后要保证从数据库的数据也要更新。
解决主从同步的三个方法：（1）1-半同步复制：从主库进行CUD操作时进行规避，办法就是等主从同步完成之后，主库上的写请求再返回。（2）2-数据库中间件在这里插入图片描述

（3）mysql主从同步定义

主从同步使得数据可以从一个数据库服务器复制到其他服务器上，在复制数据时，一个服务器充当主服务器（master），其余的服务器充当从服务器（slave）。因为复制是异步进行的，所以从服务器不需要一直连接着主服务器，从服务器甚至可以通过拨号断断续续地连接主服务器。通过配置文件，可以指定复制所有的数据库，某个数据库，甚至是某个数据库上的某个表。

使用主从同步的好处：

通过增加从服务器来提高数据库的性能，在主服务器上执行写入和更新，在从服务器上向外提供读功能，可以动态地调整从服务器的数量，从而调整整个数据库的性能。
提高数据安全-因为数据已复制到从服务器，从服务器可以终止复制进程，所以，可以在从服务器上备份而不破坏主服务器相应数据
在主服务器上生成实时数据，而在从服务器上分析这些数据，从而提高主服务器的性能

11.缓存穿透，缓存雪崩以及缓存击穿。

1.缓存穿透
（1）缓存穿透，是指查询一个数据库一定不存在的数据。正常的使用缓存流程大致是，数据查询先进行缓存查询，如果key不存在或者key已经过期，再对数据库进行查询，并把查询到的对象，放进缓存。如果数据库查询对象为空，则不放进缓存。

（2）工作流程
参数传入对象主键ID根据key从缓存中获取对象如果对象不为空，直接返回如果对象为空，进行数据库查询如果从数据库查询出的对象不为空，则放入缓存（设定过期时间）想象一下这个情况，如果传入的参数为-1，会是怎么样？这个-1，就是一定不存在的对象。就会每次都去查询数据库，而每次查询都是空，每次又都不会进行缓存。假如有恶意攻击，就可以利用这个漏洞，对数据库造成压力，甚至压垮数据库。即便是采用UUID，也是很容易找到一个不存在的KEY，进行攻击。

防止缓存穿透的方法

（1）采用缓存空值的方式，如果从数据库查询的对象为空，也放入缓存，只是设定的缓存过期时间较短，比如设置为60秒。

（2）双重检查锁防止缓存穿透.（我们一般在同一需求的请求第一次到达时从数据库检索信息，然后放到缓存中。之后该需求的请求到达时直接从缓存中取值。
在高并发时，第一个请求正在数据库检索信息未结束时，其他请求就会判断缓存中没有响应值也进入数据库查询，导致多个线程查询数据库。双重检查锁通过检查-加锁-检查的模式避免了多次查询数据库的问题。

2.缓存雪崩
（1）缓存雪崩，是指在某一个时间段，缓存集中过期失效。

产生雪崩的原因之一，比如在写本文的时候，马上就要到双十二零点，很快就会迎来一波抢购，这波商品时间比较集中的放入了缓存，假设缓存一个小时。那么到了凌晨一点钟的时候，这批商品的缓存就都过期了。而对这批商品的访问查询，都落到了数据库上，对于数据库而言，就会产生周期性的压力波峰。

（2）做电商项目的时候，一般是采取不同分类商品，缓存不同周期。在同一分类中的商品，加上一个随机因子。这样能尽可能分散缓存过期时间，而且，热门类目的商品缓存时间长一些，冷门类目的商品缓存时间短一些，也能节省缓存服务的资源。
其实集中过期，倒不是非常致命，比较致命的缓存雪崩，是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩，一定是在某个时间段集中创建缓存，那么那个时候数据库能顶住压力，这个时候，数据库也是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机，对数据库服务器造成的压力是不可预知的，很有可能瞬间就把数据库压垮。

3.缓存击穿
（1）缓存击穿，是指一个key非常热点，在不停的扛着大并发，大并发集中对这一个点进行访问，当这个key在失效的瞬间，持续的大并发就穿破缓存，直接请求数据库，就像在一个屏障上凿开了一个洞。

做电商项目的时候，把这货就成为“爆款”。

其实，大多数情况下这种爆款很难对数据库服务器造成压垮性的压力。达到这个级别的公司没有几家的。对主打商品都是早早的做好了准备，让缓存永不过期。即便某些商品自己发酵成了爆款，也是直接设为永不过期就好了。
大道至简，mutex key互斥锁真心用不上。

Tronhon

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
shu据库常见结构面试题（InnoDB和索引B+Tree）

一，InnoDB数据库存储引擎1.要查看自己的数据库使用哪种引擎（sql语句）show variables like ‘storage_engine’;2.InnoDB引擎与Myisam引擎存储一张表的区别。（1）存储一张表的差别：innodb（整体使用一个主键聚集索引的，叶子结点直接存储数据库相关数据的结构，注意：如果表的主键是类似于UUID一样随机生成的字符串，那么插入B+树就是无序的...
复制链接

扫一扫