数据库常见问题-CSDN博客

本文链接：https://blog.csdn.net/weixin_51359265/article/details/118421822

1. SQL语言包括哪些类型？
数据定义DDL：Create Table,Alter Table,Drop Table, Create/Drop Index等
数据操纵DML：Select ,insert,update,delete,
数据控制DCL：grant,revoke

2. 内联接,外联接区别？
内连接是保证两个表中所有的行都要满足连接条件，而外连接则不然。
在外连接中，某些不满条件的列也会显示出来，也就是说，只限制其中一个表的行，而不限制另一个表的行。分左连接、右连接、全连接（mysql不支持）三种。

3. 什么是存储过程？用什么来调用？
答：存储过程是一组为了完成特定功能的SQL 语句集，经编译创建并保存在数据库中，一次编译后永久有效。通过Call语句指定存储过程的名字并给出参数（如果该存储过程带有参数）来执行它。
由于存储过程是经过预编译处理的，因此如果某次操作需要执行多次SQL，使用存储过程比单纯SQL语句执行要快。存储过程不允许执行return语句，但是可以通过out参数返回多个值，存储过程一般是作为一个独立的部分来执行，存储过程是一个预编译的SQL语句。

4．触发器的作用？
答：触发器是一种特殊的存储过程，主要是通过事件来触发而被执行的。
它可以强化约束，来维护数据的完整性和一致性，可以跟踪数据库内的操作从而不允许未经许可的更新和变化。可以联级运算。如，某表上的触发器上包含对另一个表的数据操作，而该操作又会导致该表触发器被触发。触发器无法由用户直接调用，而是由于对表的【增/删/改】操作被动引发的。

5. 索引的作用？和它的优点缺点是什么？
答：索引就一种特殊的查询表，可以利用它加速对数据的检索。它很类似与现实生活中书的目录，不需要查询整本书内容就可以找到想要的数据。索引可以是唯一的，创建索引允许指定单个列或者是多个列。
缺点：它减慢了数据录入和修改的速度，同时索引也会占用一定的存储资源，因此我们在建索引的时候需要斟酌。

6. 维护数据库的完整性和一致性，你喜欢用触发器还是自写业务逻辑？为什么？
答：我是这样做的，尽可能使用约束，如主键，外键，非空字段等来约束(Check约束在mysql中可以使用但是对数据验证没有任何作用)，这样做效率最高，也最方便。其次是使用触发器，这种方法可以保证，无论什么业务系统访问数据库都可以保证数据的完整新和一致性。触发器是针对每一行的；对增删改非常频繁的表上切记不要使用触发器，因为它会非常消耗资源。最后考虑的是自写业务逻辑，但这样做麻烦，编程复杂，效率低下。

7. 什么是事务？什么是锁？事务有哪些类型？

事务：就是被绑定在一起作为一个逻辑工作单元的SQL语句分组。如果任何一个语句操作失败那么整个操作就被失败，以后操作就会回滚到操作前状态，或者是上有个节点。为了确保要么执行，要么不执行，就可以使用事务。要将有组语句作为事务考虑，就需要通过ACID测试，即原子性，一致性，隔离性和持久性。
锁：在所以的DBMS中，锁是实现事务的关键，锁可以保证事务的完整性和并发性。与现实生活中锁一样，它可以使某些数据的拥有者，在某段时间内不能使用某些数据或数据结构。当然锁还分级别的。

扁平化事务：在扁平事务中，所有的操作都在同一层次，这也是平时使用最多的事务，主要限制是不能提交或回滚事务的某一部分，要么都成功要么都回滚。
带保存点的扁平事务：解决了扁平事务的弊端，它允许事务在执行过程中回滚到较早的状态而不是全部回滚，通过在事务中插入保存点，当操作失败后可以选择回滚到最近的保存点处。
链事务：可看做第二种事务的变种，它在事务提交时，会将必要的上下文隐式传递给下一个事务，当事务失败时，可以回滚到最近的事务，不过链事务只能回滚到最近的保存点，而带保存点的扁平化事务是可以回滚到任意一个保存点。
嵌套事务：由顶层事务和子事务构成，类似于树的结构，一般顶层事务负责逻辑处理，子事务负责具体的工作，子事务可以提交，但真正的提交要等到顶层事务的提交，如果顶层事务回滚，那么所有的子事务都将回滚。
分布式事务：在分布式环境中的扁平化事务。
常用的分布式事务解决方案：
（1） XA规范，是保证强一致性的刚性事务，实现方式有两段式提交（2PC）和三段式提交（3PC），2PC需要一个事务协调者来保证事务的参与者都完成了第一阶段的准备工作，如果协调者收到了所有的参与者都准备好的消息，就会通知所有的事务执行第二阶段的提交，一般场景下两段式提交已经能很好的解决分布式事务了。然而两阶段在即使只有一个进程发生故障时，也会导致整个系统存在较长时间的阻塞。三段式提交通过增加pre-commit阶段来减少两段式提交提到的系统阻塞时间，三段式提交很少在实际中使用，简单了解就行了。
（2） TCC：是满足最终一致性的柔性事务方案。TCC采用补偿机制，核心的思想是对每一个操作都要注册对应的确认和补偿操作，分为三个阶段，try阶段主要对业务系统进行检测及资源预留，confirm阶段对业务系统进行确认提交，cancel阶段是对业务执行错误，执行回滚释放预留的资源。
（3）消息一致性方案：基本思路是将本地操作和发送消息封装在一个事务中，保证本地的操作和消息发送要么都成功，要么都失败。下游应用订阅消息，收到消息后执行对应的操作。
（4）GTS：阿里云的全局事务服务，对应的开源版本是Fescar，Fescar基于两段式提交进行改良，剥离了分布式事务方案对数据库在协议支持上的要求，使用Fescar的前提是分支事务中涉及的资源必须支持ACID事务的关系型数据库，分支的提交和回滚都依赖于本地事务来保障。了解即可。

8. 事务的基本要素？
原子性Atomicity，指事务由原子的操作序列组成，所有操作要么全部成功，要么全部失败回滚。
一致性Consistency，指事务的执行不能破坏数据库数据的完整性和一致性，一个事务在执行之前和执行之后，数据库都必须处以一致性状态。比如在做多表操作时，多个表要么都是事务后新的值，要么都是事务前的旧值。
隔离性Isolation，指多个用户并发访问数据库时，数据库为每个用户执行的事务，不能被其他事务的操作所干扰，多个并发事务之间要相互隔离。事务的隔离级别在后文中介绍。
持久性Durability，指一个事务一旦提交并执行成功，那么对数据库中数据的改变就是永久性的，即便是在数据库系统遇到故障的情况下也不会丢失提交事务的操作。

9. 事务的并发问题？事务的隔离级别有哪些？

事务的并发问题

　　1、脏读：事务A读取了事务B更新的数据，然后B回滚操作，那么A读取到的数据是脏数据

　　2、不可重复读：在一个事务里面读取了两次某个数据，读出来的数据不一致，事务 A 多次读取同一数据，事务 B 在事务A多次读取的过程中，对数据作了更新并提交，导致事务A多次读取同一数据时，结果不一致。

　　3、幻读：在一个事务里面的操作中发现了未被操作的数据，系统管理员A将数据库中所有学生的成绩从具体分数改为ABCDE等级，但是系统管理员B就在这个时候插入了一条新的学生成绩具体分数的记录，当系统管理员A改结束后发现还有一条记录没有改过来，就好像发生了幻觉一样，这就叫幻读。

　　小结：不可重复读的和幻读很容易混淆，不可重复读侧重于修改，幻读侧重于新增或删除。解决不可重复读的问题只需锁住满足条件的行，解决幻读需要锁表

事务隔离级别	脏读	不可重复读	幻读
读未提交（read-uncommitted）	是	是	是
读已提交（read-committed）	否	是	是
可重复读（repeatable-read）	否	否	是
串行化（serializable）	否	否	否

10. 什么叫视图？游标是什么？
答：视图是对一些原表选择部分列合并成的一个虚拟表格，具有和物理表相同的功能。可以对视图进行插入、更新、删除操作。对视图的修改会同步到具体数据表中。注意以下几种情况不能对视图进行插入、更新、删除的操作：

视图列中含有统计函数的情况
视图使用了GROUP BY /HAVING，DISTINCT，UNION语句的情况
视图定义时使用了子查询的情况
对视图的修改涉及到了多个基础表的数据

游标：是对查询出来的结果集作为一个单元来有效的处理。游标可以定在该单元中的特定行，从结果集的当前行检索一行或多行。可以对结果集当前行做修改。一般不使用游标，但是需要逐条处理数据的时候，游标显得十分重要。

11. 什么是主键?什么是外键?
主键是表格里的(一个或多个)字段，只用来定义表格里的行;主键里的值总是唯一的。外键是一个用来建立两个表格之间关系的约束。这种关系一般都涉及一个表格里的主键字段与另外一个表格(尽管可能是同一个表格)里的一系列相连的字段。那么这些相连的字段就是外键。

12.一个表有过多索引需要有什么样的性能考虑?
时间和空间。对一个表格的索引越多，数据库引擎用来更新、插入或者删除数据所需要的时间就越多，因为在数据操控发生的时候索引也必须要维护。

13.你可以用什么来确保表格里的字段只接受特定范围里的值?
这个问题可以用多种方式来回答，但是只有一个答案是"好"答案。您希望听到的回答是Check限制（MYSQL有，但是没有强制约束，使用了也没用），它在数据库表格里被定义，用来限制输入该列的值。
触发器也可以被用来限制数据库表格里的字段能够接受的值，但是这种办法要求触发器在表格里被定义，这可能会在某些情况下影响到性能。因此，微软建议使用Check限制而不是其他的方式来限制域的完整性。

15. 使用索引查询一定能提高查询的性能吗？为什么
通常,通过索引查询数据比全表扫描要快.但是我们也必须注意到它的代价.
索引需要空间来存储,也需要定期维护, 每当有记录在表中增减或索引列被修改时,索引本身也会被修改. 这意味着每条记录的INSERT,DELETE,UPDATE将为此多付出磁盘I/O. 因为索引需要额外的存储空间和处理,那些不必要的索引反而会使查询反应时间变慢.使用索引查询不一定能提高查询性能,索引范围查询(INDEX RANGE SCAN)适用于两种情况:
1.基于一个范围的检索,一般查询返回结果集小于表中记录数的30%宜采用;
2.基于非唯一性索引的检索
索引就是为了提高查询性能而存在的,如果在查询中索引没有提高性能,只能说是用错了索引,或者讲是场合不同

16. 列举几种表连接方式，并写出SQL语句? 什么是相关子查询？关联查询和相关子查询的区别？
内连接、外连接（左、右、全）、自连接（特殊的内连接）、交叉连接
Or hash join/merge join/nest loop(cluster join)/index join
1)内连接:只连接匹配的行
select A.c1,B.c2 from A join B on A.c3 = B.c3;
2)左外连接:包含左边表的全部行（不管右边的表中是否存在与它们匹配的行）以及右边表中全部匹配的行，最终结果数大于等于左表行数
select A.c1,B.c2 from A left join B on A.c3 = B.c3;
3)右外连接:包含右边表的全部行（不管左边的表中是否存在与它们匹配的行）以及左边表中全部匹配的行，最终结果数大于等于右表结果数
select A.c1,B.c2 from A right join B on A.c3 = B.c3;
4)全外连接:包含左、右两个表的全部行，不管在另一边的表中是否存在与它们匹配的行
select A.c1,B.c2 from A full join B on A.c3 = B.c3;
5)交叉连接又称隐式的内联查询:生成笛卡尔积——它不使用任何匹配或者选取条件，而是直接将一个数据源中的每个行与另一个数据源的每个行一一匹配
select A.c1,B.c2 from A,B;
6）相关子查询是一种包含子查询的特殊类型的查询。查询里包含的子查询会用到外部查询的值。
SELECT * FROM A WHERE A.id IN（SELECT B.aId FROM B WHERE B.name=A.name）
7）表关联可能有多条记录，子查询只有一条记录，如果需要唯一的列，最好走子查询

交叉连接与内连接，查询的结果是一样的，但是效率不同，内连接查询的效率更高。

17 如何优化数据库，如何提高数据库的性能？
主要从：表结构、索引、sql语句考虑
（1）表结构如：合适的字段类型、适当增加中间表、适当拆分表、增加冗余字段避免关联查询、尽量不要使用null
（2）索引：不要盲目使用索引、要在数据差别大的列上使用索引、要在查询常用到的列上增加索引、根据具体查询情况选择合适的索引数据结构
（3）查询时不要select *，注意查询是否使用了索引、减少关联查询、减少in和not in这些查询、针对不同的情况选择in或者exists查询
（4）适当的使用存储过程

18. 谈谈数据库设计的三范式
第一范式的定义：所有的域都应该是原子性的，即数据库表的每一列都是不可分割的原子数据项，则这个表属于第一范式（常记成1NF）。简而言之："每一字段只存储一个值"。例如:职工号，姓名，电话号码组成一个表（一个人可能有一个办公室电话和一个家里电话号码）
第二范式的定义：如果一个表属于1NF，任何属性只依赖于关键字，则这个表属于第二范式（常记成2NF ）。简而言之：必须先符合1NF的条件，且每一行都能被唯一的识别。将1NF转换成2NF的方法是添加主键。例如：学号，姓名，课程名，成绩
第三范式的定义：如果一个表属于2NF，且不包含传递依赖性，则这个表是第三范式（常记成 3NF）。简而言之，第三范式就是属性不依赖于其它非主属性。例如，存在一个部门信息表，其中每个部门有部门编号（dept_id）、部门名称、部门简介等信息。那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表，则根据第三范式（3NF）也应该构建它，否则就会有大量的数据冗余。

19. 设计数据库应注意那些问题
首先应尽量满足三范式的要求，在一定程度上打破三范式的要求以提高数据库的性能。例如，我们创建某些表的时候，不仅会插入外键，还会插入相关的属性，这违反了第三范式，但这样做的好处，就是我们在业务查询的时候会减少很多关联查询，从而提高查询效率。

20. 表与表之间的关联关系
分为3种：一对一、一对多、多对多。

21. 主键和外键的区别
主键在本表中是唯一的、不可为空的，外键可以重复可以唯空；外键和另一张表的主键关联，不能创建对应表中不存在的外键。

22. 游标的作用？如何知道游标已经到了最后？
游标用于定位结果集的行，在mysql中用DECLARE CONTINUE HANDLER FOR SQLSTATE '02000' SET done = 1; 可以判断是否到了最后，通常此变量不等于0表示出错或到了最后。

23. 事前触发和事后触发有何区别？语句级触发和行级触发有何区别？
事前触发器运行于触发事件发生之前，如表的插入、更新、删除之前，而事后触发器运行于触发事件发生之后，如表的插入、更新、删除之后。通常事前触发器可以获取事件之前和新的字段值。语句级触发器可以在语句执行前或后执行，而行级触发在触发器所影响的每一行触发一次。

24. 数据库设计的必要性及设计步骤
好的数据库结构有利于：节省数据的存储空间，能够保证数据的完整性，方便进行数据库应用系统的开发
设计不好的数据库结构将导致：数据冗余、存储空间浪费和内存空间浪费
不管数据库的大小和复杂程度如何，可以用下列基本步骤来设计数据库：收集信息--标识对象--设计数据模型--标识每个对象--存储的信息类型–标识对象之间的关系

25. 什么是数据模型？什么是规范化？
数据模型是一种标识实体类型及其实体间联系的模型。典型的数据模型有网状模型、层次模型和关系模型。
从关系数据库的表中，除去冗余数据的过程称为规范化。包括：精简数据库的结构，从表中删除冗余的列，标识所有依赖于其它数据的数据

26. 说出一些数据库优化方面的经验?
用PreparedStatement 一般来说比Statement性能高：一个sql 发给服务器去执行，涉及步骤：语法检查、语义分析，编译，缓存
“inert into user values(1,1,1)”-?二进制
“inert into user values(2,2,2)”-?二进制
“inert into user values(?,?,?)”-?二进制

有外键约束会影响插入和删除性能，如果程序能够保证数据的完整性，那在设计数据库时就去掉外键。（比喻：就好比免检产品，就是为了提高效率，充分相信产品的制造商）
（对于hibernate来说，就应该有一个变化：empleyee->Deptment对象，现在设计时就成了employee?deptid）

看mysql帮助文档子查询章节的最后部分，例如，根据扫描的原理，下面的子查询语句要比第二条关联查询的效率高：
1)select e.name,e.salary where e.managerid=(select id from employee where name='zxx');
2)select e.name,e.salary,m.name,m.salary from employees e,employees m where
e.managerid = m.id and m.name='zxx';

表中允许适当冗余，譬如，主题帖的回复数量和最后回复时间等
将姓名和密码单独从用户表中独立出来。这可以是非常好的一对一的案例哟！
sql语句全部大写，特别是列名和表名都大写。特别是sql命令的缓存功能，更加需要统一大小写，sql语句?发给oracle服务器?语法检查和编译成为内部指令?缓存和执行指令。根据缓存的特点，不要拼凑条件，而是用?和PreparedStatment
还有索引对查询性能的改进也是值得关注的。

27. union和union all有什么不同?
Union和Union All的区别之一在于对重复结果的处理。

UNION在进行表链接后会筛选掉重复的记录，所以在表链接后会对所产生的结果集进行排序运算，删除重复的记录再返回结果。
而UNION ALL只是简单的将两个结果合并后就返回。这样，如果返回的两个结果集中有重复的数据，那么返回的结果集就会包含重复的数据了。
从效率上说，UNION ALL 要比UNION快很多，所以，如果可以确认合并的两个结果集中不包含重复的数据的话，那么就使用UNION ALL

28. 几种索引类型？

MySQL数据库几个基本的索引类型：普通索引、唯一索引、主键索引、组合索引、全文索引

索引加快数据库的检索速度
索引降低了插入、删除、修改等维护任务的速度
唯一索引可以确保每一行数据的唯一性
通过使用索引，可以在查询的过程中使用优化隐藏器，提高系统的性能
索引需要占物理和数据空间

29. 数据库的乐观锁和悲观锁是什么？数据库表锁和行锁又是什么？

数据库管理系统（DBMS）中的并发控制的任务是确保在多个事务同时存取数据库中同一数据时不破坏事务的隔离性和统一性以及数据库的统一性。
乐观并发控制(乐观锁)和悲观并发控制（悲观锁）是并发控制主要采用的技术手段。

悲观锁：假定会发生并发冲突，屏蔽一切可能违反数据完整性的操作
乐观锁：假设不会发生并发冲突，只在提交操作时检查是否违反数据完整性。

在MySQL中引擎为InnoDB的表支持表锁和行锁，而引擎为MyISAM的表只支持表锁

表锁：开销小，加锁快；不会出现死锁；锁定力度大，发生锁冲突概率高，并发度最低
行锁：开销大，加锁慢；会出现死锁；锁定粒度小，发生锁冲突的概率低，并发度高

30. char和vachar区别？

char是固定长度，处理速度比vachar快，费内存空间，当存储的值没有达到指定的范围时，会用空格替代。
vachar是不固定长度，节约存储空间，存储的是真实的值。
如：存储字符串'abc'
使用char(10)，表示存储的字符将占10个字节（包括7个空字符）
使用varchar(10)，则表示只占3个字节，10是最大值，当存储的字符小于10时，按照实际的长度存储。

31. 什么是E-R图？

E-R图也称实体-联系图(Entity Relationship Diagram)，提供了表示实体类型、属性和联系的方法，用来描述现实世界的概念模型。

ER图中有如下四个成分：

矩形框：表示实体，在框中记入实体名。

菱形框：表示联系，在框中记入联系名。

椭圆形框：表示实体或联系的属性，将属性名记入框中。对于主属性名，则在其名称下划一下划线。

连线：实体与属性之间；实体与联系之间；联系与属性之间用直线相连，并在直线上标注联系的类型。（对于一对一联系，要在两个实体连线方向各写1；对于一对多联系，要在一的一方写1，多的一方写N；对于多对多关系，则要在两个实体连线方向各写N,M。

E-R图的3个基本要素是实体、属性和联系

32.MySQL两种引擎InnoDB和MyISAM的区别？

MyISAM不支持事务，而InnoDB支持事务。
MyISAM锁的是表锁（表锁又分读锁和写锁），而InnoDB锁为行级锁。
MyISAM支持全文类型索引，而InnoDB不支持。
MyISAM相对简单，所以在效率上要优于InnoDB，小型应用可以考虑使用MyISAM。
MyISAM表是保存成文件的形式，在跨平台的数据转移中使用MyISAM存储会省去不少的麻烦。
InnoDB表比MyISAM表更安全，可以在保证数据不会丢失的情况下，切换非事务表到事务表（alter table tablename type=innodb）。

33. 如何解决MYSQL数据库中文乱码问题？

建表和建库的时候指定字符集。