shu据库常见结构面试题(InnoDB和索引B+Tree)

一,InnoDB数据库存储引擎

1.要查看自己的数据库使用哪种引擎(sql语句)

show variables like ‘storage_engine’;

2.InnoDB引擎与Myisam引擎存储一张表的区别。

(1)存储一张表的差别:innodb(整体使用一个主键聚集索引的,叶子结点直接存储数据库相关数据的结构,注意:如果表的主键是类似于UUID一样随机生成的字符串,那么插入B+树就是无序的,这对于B+树的结构整体是不良好的。如果主键是自增的数字就比较好,只需要在存储结构的尾节点加入数据就可以了,比较方便)
(2)myisam引擎(有三个文件组成:定义文件,数据文件,索引文件)

3.InnoDB引擎与Myisam引擎存储索引的区别。第一个重大区别是InnoDB的数据文件本身就是索引文件,从上文知道,MyISAM索引文件和数据文件是分离的,索引文件仅保存数据记录的地址。)。。。(所以InnoDB要求表必须有主键(MyISAM可以没有),,第二个与MyISAM索引的不同是InnoDB的辅助索引data域存储相应记录主键的值而不是地址。换句话说,InnoDB的所有辅助索引都引用主键作为data域)
(1)innodb:innodb存储表就是通过一个大的聚集索引建立的,这个聚集索引有主键聚集产生。聚集索引就是一个B+树的结构,B+树的叶子结点直接存储的就是数据库的相关数据。除此之外,其他属性的索引都是二级索引,二级索引的B+树结构的叶子结点存储的就是主键的信息。一般我们通过索引检索信息都是通过两次检索B+树的过程。首次就是通过二级索引检索B+树搜索出主键信息,,然后根据主键信息通过聚集索引找出相应的表的数值信息。

(2)myisam引擎:myisam引擎就是通过一个大的非聚集索引存储信息的,聚集索引也是一个B+树的结构,但是B+树的叶子结点存储的信息是数据记录的地址。Myisam索引中,主索引和辅助索引没有什么大的区别,唯一的区别就是主索引要求key的值是唯一的,而副主索引不一定唯一。而且Myisam索引可以没有主键,innodb必须要有主键。然后主索引和副主索引查找相关关数据的索引检索算法都是根据B+输的算法索引,如果指定的key存在,则就去除data雨中的数据记录地址,根据数据记录地址,读取相应的数据记录。

3.组合索引: 最左前缀原理与相关优化

高效使用索引的首要条件是知道什么样的查询会使用到索引,这个问题和B+Tree中的“最左前缀原理”有关。

这里先说一下联合索引的概念。在上文中,我们都是假设索引只引用了单个的列,实际上,MySQL中的索引可以以一定顺序引用多个列,这种索引叫做联合索引,一般的,一个联合索引是一个有序元组<a1, a2, …, an>,其中各个元素均为数据表的一列。另外,单列索引可以看成联合索引元素数为1的特例。

4.索引的存储方式(分类):

索引是在MySQL的存储引擎层中实现的,而不是在服务层实现的。所以各种存储引擎支持的索引并不相同,MySQL目前提供了以下4种索引。

B-Tree 索引:最常见的索引类型,大部分引擎都支持B树索引。
HASH 索引:只有Memory引擎支持,使用场景简单。
R-Tree 索引(空间索引):空间索引是MyISAM的一种特殊索引类型,主要用于地理空间数据类型。
Full-text (全文索引):全文索引也是MyISAM的一种特殊索引类型,主要用于全文索引,InnoDB从MySQL5.6版本提供对全文索引的支持。

6.2 索引优化策略

场景

最左匹配原则、主键外、关键字where、on、groupby、orderby、区分度高、较小的数据列使用索引、索引不参与计算、
较长的字符串要建立索引、尽量扩展索引如a到a,b、不要过多创建索引、li%使用到索引(走索引)。

最左前缀匹配原则,上面讲到了
主键外检一定要建索引
对 where,on,group by,order by 中出现的列使用索引
尽量选择区分度高的列作为索引,区分度的公式是count(distinct col)/count(*),表示字段不重复的比例,比例越大我们扫描的记录数越少,唯一键的区分度是1,而一些状态、性别字段可能在大数据面前区分度就是0
对较小的数据列使用索引,这样会使索引文件更小,同时内存中也可以装载更多的索引键
索引列不能参与计算,保持列“干净”,比如from_unixtime(create_time) = ’2014-05-29’就不能使用到索引,原因很简单,b+树中存的都是数据表中的字段值,但进行检索时,需要把所有元素都应用函数才能比较,显然成本太大。所以语句应该写成create_time = unix_timestamp(’2014-05-29’);
为较长的字符串使用前缀索引
尽量的扩展索引,不要新建索引。比如表中已经有a的索引,现在要加(a,b)的索引,那么只需要修改原来的索引即可
不要过多创建索引, 权衡索引个数与DML之间关系,DML也就是插入、删除数据操作。这里需要权衡一个问题,建立索引的目的是为了提高查询效率的,但建立的索引过多,会影响插入、删除数据的速度,因为我们修改的表数据,索引也需要进行调整重建
对于like查询,”%”不要放在前面。
SELECT * FROMhoudunwangWHEREunameLIKE’后盾%’ – 走索引
SELECT * FROMhoudunwangWHEREunameLIKE “%后盾%” – 不走索引
查询where条件数据类型不匹配也无法使用索引
字符串与数字比较不使用索引;
CREATE TABLEa(achar(10));
EXPLAIN SELECT * FROMaWHEREa=“1” – 走索引
EXPLAIN SELECT * FROM a WHERE a=1 – 不走索引
正则表达式不使用索引,这应该很好理解,所以为什么在SQL中很难看到regexp关键字的原因

5.B+树与B树的区别:分析叶子结点以及非叶子结点的结构,得出区别。

B+tree就是B-tree的改进版本。B-tree在每个节点都可以保存数据(键值对),而B+tree只有在叶子节点才可以存储数据。上图为一个B+tree。不同于B-tree在每个节点都可以存储键值对,B+tree只在叶子节点存储键值对,在其他内部节点只存储键值。如图所示,在父节点也在其叶子节点中。这是因为只有叶子节点保存数据。并且每个叶子节点和其相邻的节点处也有连接,在某些情况下,可以加快搜索速度。

6.B+树与二叉树的区别:B+树是平衡多路查找树,二叉树只有两路。叶子结点非叶子节点存储结构差别。

7.索引在B+树上怎么存储,存放的。

Innodb引擎存储表就是通过一个大的聚集索引进行存储的,该索引通过主键建立,这个大的聚集索引结构就是B+树,B+树的每个叶子结点存储的是相关表的数据。除此之外,其他数据索引采用二级索引也就是辅助索引,辅助索引的叶子结点存储的是主键。一般查找的过程就是首先通过二级索引查找出来主键,然后在根据聚集索引找到相关的数据。

8.二级索引(辅助索引):

在B+树中辅助索引的叶子结点就是主键,非主键属性查询表信息都是通过二级索引进行查询的,首先通过二级索引查找出主键,然后根据逐渐痛过聚集索引查询得到相关的数据信息。

8.一条sql语句在mysql中的执行过程

在这里插入图片描述

9.InnoDB怎么实现rollback事务回滚功能。

我使用的是innoDB引擎,比起myisam引擎,它锁的粒度更小。myisam在事务中锁表,innoDB锁行,并且在每行数据都加入两个列记录该行的最后修改时间和删除时间。在事务中,获取类似于快照的,操作行的数据,然后进行一系列操作。如果事务正常结束就写回表,如果发生异常就不回写。

10.数据库的主从同步。

(1)通过设置主从数据库实现读写分离,主数据库负责“写操作”,从数据库负责“读操作”,根据压力情况,从数据库可以部署多个提高“读”的速度,借此来提高系统总体的性能。
基础知识
(2)要实现读写分离,就要解决主从数据库数据同步的问题,在主数据库写入数据后要保证从数据库的数据也要更新。

解决主从同步的三个方法:(1)1-半同步复制:从主库进行CUD操作时进行规避,办法就是等主从同步完成之后,主库上的写请求再返回。(2)2-数据库中间件在这里插入图片描述

(3)mysql主从同步定义

主从同步使得数据可以从一个数据库服务器复制到其他服务器上,在复制数据时,一个服务器充当主服务器(master),其余的服务器充当从服务器(slave)。因为复制是异步进行的,所以从服务器不需要一直连接着主服务器,从服务器甚至可以通过拨号断断续续地连接主服务器。通过配置文件,可以指定复制所有的数据库,某个数据库,甚至是某个数据库上的某个表。

使用主从同步的好处:

通过增加从服务器来提高数据库的性能,在主服务器上执行写入和更新,在从服务器上向外提供读功能,可以动态地调整从服务器的数量,从而调整整个数据库的性能。
提高数据安全-因为数据已复制到从服务器,从服务器可以终止复制进程,所以,可以在从服务器上备份而不破坏主服务器相应数据
在主服务器上生成实时数据,而在从服务器上分析这些数据,从而提高主服务器的性能

11.缓存穿透,缓存雪崩以及缓存击穿。

1.缓存穿透
(1)缓存穿透,是指查询一个数据库一定不存在的数据。正常的使用缓存流程大致是,数据查询先进行缓存查询,如果key不存在或者key已经过期,再对数据库进行查询,并把查询到的对象,放进缓存。如果数据库查询对象为空,则不放进缓存。

(2)工作流程
参数传入对象主键ID根据key从缓存中获取对象如果对象不为空,直接返回如果对象为空,进行数据库查询如果从数据库查询出的对象不为空,则放入缓存(设定过期时间)想象一下这个情况,如果传入的参数为-1,会是怎么样?这个-1,就是一定不存在的对象。就会每次都去查询数据库,而每次查询都是空,每次又都不会进行缓存。假如有恶意攻击,就可以利用这个漏洞,对数据库造成压力,甚至压垮数据库。即便是采用UUID,也是很容易找到一个不存在的KEY,进行攻击。

防止缓存穿透的方法

(1)采用缓存空值的方式,如果从数据库查询的对象为空,也放入缓存,只是设定的缓存过期时间较短,比如设置为60秒。

2)双重检查锁防止缓存穿透.(我们一般在同一需求的请求第一次到达时从数据库检索信息,然后放到缓存中。之后该需求的请求到达时直接从缓存中取值。
在高并发时,第一个请求正在数据库检索信息未结束时,其他请求就会判断缓存中没有响应值也进入数据库查询,导致多个线程查询数据库。双重检查锁通过 检查-加锁-检查 的模式避免了多次查询数据库的问题。

2.缓存雪崩
(1)缓存雪崩,是指在某一个时间段,缓存集中过期失效。

产生雪崩的原因之一,比如在写本文的时候,马上就要到双十二零点,很快就会迎来一波抢购,这波商品时间比较集中的放入了缓存,假设缓存一个小时。那么到了凌晨一点钟的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。

(2)做电商项目的时候,一般是采取不同分类商品,缓存不同周期。在同一分类中的商品,加上一个随机因子。这样能尽可能分散缓存过期时间,而且,热门类目的商品缓存时间长一些,冷门类目的商品缓存时间短一些,也能节省缓存服务的资源。
其实集中过期,倒不是非常致命,比较致命的缓存雪崩,是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,那么那个时候数据库能顶住压力,这个时候,数据库也是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮。

3.缓存击穿
(1)缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞。

做电商项目的时候,把这货就成为“爆款”。

其实,大多数情况下这种爆款很难对数据库服务器造成压垮性的压力。达到这个级别的公司没有几家的。对主打商品都是早早的做好了准备,让缓存永不过期。即便某些商品自己发酵成了爆款,也是直接设为永不过期就好了。
大道至简,mutex key互斥锁真心用不上。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Tronhon

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值