Java面试八股文(数据库篇)持续更新中。。。

1、什么是数据库事务

        数据库事务是指一组数据库操作,它们作为一个不可分割的单元进行执行。在数据库中,事务可以包含多个读写数据库操作,例如插入、更新、删除等。事务具有以下特点:

  1. 原子性(Atomicity):事务中的操作要么全部执行成功,要么全部执行失败回滚,不存在部分成功部分失败的情况。

  2. 一致性(Consistency):事务执行成功后,数据库从一个一致的状态转换到另一个一致的状态。事务执行过程中的中间状态不会对其他事务可见。

  3. 隔离性(Isolation):事务的执行是相互隔离的,每个事务都感觉不到其他事务的存在。即使多个事务并发执行,它们之间也不会相互影响。

  4. 持久性(Durability):事务一旦提交,其结果将永久保存在数据库中,并且对其他事务是可见的。

        数据库事务可以保证数据的一致性和完整性,并且提供了并发控制机制,确保多个事务之间的正确执行。如果在执行过程中发生错误或者系统故障,事务可以回滚到之前的状态,保证数据的一致性。

2、什么是脏读、幻读、不可重复读

        脏读(Dirty Read)是指在一个事务中读取了另一个未提交事务中的数据。这样做可能会导致读取到不一致或错误的数据。

        幻读(Phantom Read)是指在一个事务中多次进行相同查询,但每次查询都返回不同的结果集。这可能是因为在这些查询之间有另一个事务插入或删除了数据。

        不可重复读(Non-Repeatable Read)是指在同一个事务中多次读取同一条记录,但每次读取得到的数据不一致。这可能是因为在这些读取之间有其他事务修改了数据。

        这三个问题都是并发事务操作数据库时可能发生的数据一致性问题,需要采取一些机制来解决,比如事务隔离级别的设置、锁机制等。

3、索引的分类

  1. 主键索引(Primary Key Index):主键索引是一种唯一性索引,它保证表中每一行数据的主键值都是唯一的。主键索引可以加快根据主键进行查找和修改的速度。

  2. 唯一索引(Unique Index):唯一索引是一种保证索引列数据是唯一的索引。唯一索引可以加快根据唯一值进行查找和修改的速度。

  3. 聚簇索引(Clustered Index):聚簇索引是一种将数据物理上存储在磁盘上按照索引的顺序来组织的索引。聚簇索引可以加快按照索引顺序查询的速度,但是对于插入、删除操作性能较差。

  4. 非聚簇索引(Non-clustered Index):非聚簇索引是相对于聚簇索引而言的,它将索引的逻辑顺序与数据的物理顺序分离。非聚簇索引可以加快查询速度,但是对于插入、删除操作性能较好。

  5. 复合索引(Composite Index):复合索引是由多个列组成的索引,它可以加快多列组合查询的速度。

  6. 全文索引(Full Text Index):全文索引是一种用于全文搜索的索引,可以加快对文本内容的搜索速度。

  7. Hash索引(Hash Index): Hash索引是通过将索引列数据进行哈希计算,将哈希值作为索引值,快速定位数据。

4、MySQL中,如何定位慢查询

        在MySQL中,可以使用以下方法定位慢查询:

  1. 使用慢查询日志:在MySQL的配置文件中,设置slow_query_log参数为1,开启慢查询日志功能。然后设置long_query_time参数,指定查询执行时间超过该值的查询被记录到慢查询日志中。查询执行时间超过该值的查询将被记录到慢查询日志文件中,可以通过查看慢查询日志来定位慢查询。

  2. 使用Percona工具包:Percona提供了一套工具包,其中包括了一些性能分析工具,例如Percona Toolkit、Percona Monitoring and Management(Percona软件中心)等。这些工具提供了查看查询分析和监控数据库性能的功能,可以帮助定位慢查询。

  3. 使用MySQL自带的性能Schema:MySQL自带了性能Schema,可以通过查询performance_schema表来获取有关查询性能的信息。使用性能Schema可以查看哪些查询最耗时。

  4. 使用EXPLAIN语句:使用EXPLAIN语句可以查看查询执行计划,包括使用的索引、Join操作等。通过分析查询执行计划,可以找到查询中的性能瓶颈。

5、什么是索引

        它是帮助MySQL高效获取数据 的数据结构,主要是用来提高数据检索的效率,降低数据库的IO成本,同时 通过索引列对数据进行排序,降低数据排序的成本,也能降低了CPU的消耗。

6、索引的底层数据结构了解吗

        MySQL的默认的存储引擎InnoDB采用的B+树的数据结构来存储索 引,选择B+树的主要的原因是:第一阶数更多,路径更短,第二个磁盘读写 代价B+树更低,非叶子节点只存储指针,叶子阶段存储数据,第三是B+树便 于扫库和区间查询,叶子节点是一个双向链表。

7、B树和B+树的区别是什么

        B树和B+树是两种常用的数据结构,主要用于在数据库中进行索引。它们的区别在于以下几个方面:

  1. 数据存储方式:B树的每个节点既存储数据,又存储索引,而B+树的内部节点只存储索引,数据都存储在叶子节点上。这意味着B+树的叶子节点形成了一个有序链表,方便范围查询和顺序遍历。

  2. 叶子节点的指针:在B树中,叶子节点之间没有指针连接,各个叶子节点是独立的。而B+树的叶子节点之间有指针连接,形成了一个链表,可以进行范围查询和顺序遍历。

  3. 数据查找:在B树中,为了确定数据是否存在于树中,需要在内部节点中进行查找,效率较低。而B+树只需要在叶子节点中进行查找,效率较高。

  4. 索引效果:由于B+树的叶子节点形成了有序链表,可以大大提高范围查询的效率。而B树的范围查询需要遍历整个树,效率较低。

8、什么是聚簇索引什么是非聚簇索引 ?

        聚簇索引主要是指数据与索引放到一块,B+树的叶子节点保存了整行数据,有且只有一个,一般情况下主键在作为聚簇索引的。

        非聚簇索引值的是数据与索引分开存储,B+树的叶子节点保存对应的主键, 可以有多个,一般我们自己定义的索引都是非聚簇索引。

9、什么是回表查询

        回表查询是一种数据库查询的执行方式,用于获取不在数据库主存中的数据。当查询需要的数据不在数据库的缓存中时,数据库系统需要从磁盘读取数据,这个过程被称为回表。通常,回表查询的效率相对较低,因为需要从磁盘读取数据会带来较高的IO开销。因此,为了提高性能,数据库会采用各种缓存技术来尽量减少回表查询的次数。

10、什么叫覆盖索引

        覆盖索引是指select查询语句使用了索引,在返回的列,必须在索引中全部能够找到,如果我们使用id查询,它会直接走聚集索引查询,一次索引扫描,直接返回数据,性能高。

         如果按照二级索引查询数据的时候,返回的列中没有创建索引,有可能会触 发回表查询,尽量避免使用select *,尽量在返回的列中都包含添加索引的字段。

11、索引创建原则有哪些

        1.选择适当的索引列:索引应选择那些经常被查询的列作为索引列,尤其是那些用于连接表的列、经常用于WHERE、ORDER BY和GROUP BY子句的列。

        2.避免过多的索引:过多的索引会占用过多的磁盘空间和内存,使得数据的插入、更新和删除等操作变慢,同时也会增加查询优化器的负担。

        3.避免过长的索引列:索引列的长度越长,占用的存储空间越多,检索速度也越慢。通常情况下,索引列的长度应该尽可能地短。

        4.选择合适的索引类型:常见的索引类型包括B-Tree索引、哈希索引和全文索引等。应根据具体的应用场景选择最适合的索引类型。

        5.定期维护和优化索引:随着数据的增长和变化,索引的性能可能会下降。因此,需要定期对索引进行维护和优化,包括重建索引、重新分析统计信息等操作。

        6.使用复合索引:复合索引是指由多个列组成的索引。当多个列经常在查询中同时使用时,可以考虑创建复合索引,以提高查询的性能。

        7.避免无效的索引:某些情况下,创建索引可能并不能提高查询的性能,甚至可能导致性能下降。因此,需要仔细评估每个索引的必要性,并避免创建无效的索引。

12、什么情况下索引会失效 

  1. 数据量较小:当数据量较小时,数据库引擎可能会选择全表扫描而不是使用索引,因为全表扫描的成本更低。

  2. 索引列被函数处理:如果查询中对索引列使用了函数,数据库引擎可能无法使用索引,例如:SELECT * FROM table WHERE UPPER(column) = 'VALUE'。

  3. 值分布不均匀:如果索引列上的值分布不均匀,即某些值出现的频率非常高,而其他值出现的频率非常低,数据库引擎可能会选择不使用索引。

  4. 复合索引顺序不匹配:在使用复合索引时,查询中的列顺序必须与索引中的列顺序一致,否则索引会失效。

  5. 使用LIKE操作符:如果在查询中使用LIKE操作符,并且通配符%出现在查询的开头,索引也会失效。

  6. 查询的条件与索引列的数据类型不一致:如果查询的条件与索引列的数据类型不一致,数据库引擎可能无法使用索引。例如:索引列为字符串类型,查询条件为数字类型。

  7. 索引被禁用或损坏:如果索引被禁用或损坏,数据库引擎将无法使用索引。

13、sql的优化的经验

  1. 使用索引:为频繁查询的列添加索引,可以加快查询速度。但是要注意不要滥用索引,过多的索引会影响写入性能。

  2. 避免使用SELECT *:只选择需要的列,避免查询不需要的列,可以减少IO操作,提高查询效率。

  3. 合理使用JOIN:在使用JOIN时,要选择合适的JOIN类型,避免使用不必要的JOIN操作。还要注意JOIN的连接条件,提高JOIN操作的效率。

  4. 适当分割大的查询:对于复杂的查询,可以拆分为多个简单的查询,分别执行,然后再进行合并。这样可以减少查询时间,提高查询效率。

  5. 避免使用子查询:子查询会增加查询的复杂度,可以考虑使用JOIN来替代子查询。

  6. 使用EXPLAIN分析查询计划:使用EXPLAIN命令可以查看查询的执行计划,从而找出慢查询的原因,进行优化。

  7. 合理使用数据库连接池:使用连接池可以减少连接创建和销毁的开销,提高数据库的性能。

  8. 优化数据模型:合理设计数据模型,避免冗余数据和不必要的关联表,可以提高查询效率。

  9. 定期优化数据库:定期进行数据库维护,包括重建索引、优化表结构、清理无用数据等,可以提高数据库的性能。

  10. 使用批量操作:对于批量的插入、更新和删除操作,可以使用批量操作的方式,减少与数据库的交互次数,提高操作效率。

  • 15
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值