【数据库复习】数据库三范式，数据类型，索引（概念，优缺点，如何验证索引满足需求），事务（ACID，脏读/幻读/不可重复读，隔离级别）

最新推荐文章于 2022-06-09 16:13:32 发布

穿撒板儿的追风少女

最新推荐文章于 2022-06-09 16:13:32 发布

阅读量318

点赞数

分类专栏：数据库文章标签：数据库 mysql sql 索引

本文链接：https://blog.csdn.net/qq_43360037/article/details/108222608

版权

数据库专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1. 数据库的三范式是什么？

第一范式：保证每个字段的原子性，不可拆分。
第二范式：确保表中的每列都和主键相关
第三范式：非主键列之间没有传递函数依赖关系（确保每列都和主键列直接相关,而不是间接相关）

2. 数据库的数据类型

① 数值类型

数据类型	大小	说明	对应的java类型
BIT[M]	M指定位数，默认为1	二进制数，M范围从1-64，存储数值范围从0到2^M-1	常用Boolean类型对应BIT，此时默认是1位，也就是只能存0和1
TINYINT	1字节		Byte
SMALLINT	2字节		Short
INT	4字节		Integer
BIGINT	8字节		Long
FLOAT(M,D)	4字节	单精度浮点数，M指定长度，D指定小数位数，会发生精度丢失	Float
DOUBLE(M,D)	8字节		Double
DECIMAL(M,D)	M/D最大值+2	双精度，M指定长度，D指定小数位数，精确数值	BigDecimal
NUMERIC(M,D)	M/D最大值+2	和DECIMAL一样	BigDecimal

float ，double ，decimal
decimal可以用来存比bigint还大的整形，能存储精确的数值
而float和double有取值范围
计算时float和double比decimal效率更高

② 字符串类型

数据类型	说明	对应的java类型
CHAR	定长字符串	String
VARCHAR(SIZE)	可变长度字符串	String
TEXT	长文本数据	String
MEDIUMTEXT	中等长度文本数据	String
BLOB	二进制形式的长文本数据	byte[]

char 和 varchar 的区别是什么？
char是定长字符串，varchar是可变长度字符串，后者比前者更节省空间
char中如果插入数据长度小于char的固定长度时，则用空格填充；varchar插入数据是多长，就按多长来存储
char由于长度固定，所以存取速度高于varchar，占用空间也会大于varchar；varchar刚好相反，存取速度慢，占用空间小
对于经常变更的值，建议用char，因为他不易产生碎片
对于比较短的列，char比varchar在存储空间上更有效率
varchar(50) 中的50是什么意思？
表示最多存放50个字符，varchar(50)和varchar(200)存储同一个字符所占空间都是一样的，但是varchar(200)会比(50)消耗内存多一些
int(10) ,char(10)，varchar(10)
int(10)中的10表示显示的数据的长度，而不是存储数据的大小
char(10)和varchar(10)表示存储数据的大小，也就是存储多少个字符
char(10)表示存储10个字符，不足10个用空格补齐
varchar(10)表示存储10个变长字符，字符有几个就是几个，不足10个就不足10个
注意要尽量避免使用TEXT或BLOB类型，因为查询的时候会使用临时表，导致严重的性能开销

③ 日期类型

数据类型	大小	说明	对应的java类型
DATETIME	8字节	范围从1000年-9999年，不会进行时区的检索和转换	java.util.Data , java.sql.Timestamp
TIMESTAMP	4字节	范围从1970年-2038年，自动检索当前时区并进行转换	java.util.Data , java.sql.Timestamp

尽量使用TIMESTAMP，空间效率效率会比DATETIME高

3. 数据库的索引

① 什么是索引

索引是一种特殊的文件，包含着对数据表里所有记录的引用指针。
索引是一种数据结构，他通常使用B树，B+树，hash实现。
优点：索引就相当于目录，可以快速定位，检索数据，对数据库性能的提高有很大帮助。
缺点：由于索引是一种文件，是要占据一定的物理空间的；并且创建和维护索引要耗费时间（当对数据库表中数据增删改的时候，索引也要动态维护，会降低增删改的执行效率）

② 索引的使用场景

当满足以下条件时，考虑对表中的某列或某几列创建索引，以提高查询效率：

数据量特别大，平常的查询此时比较耗时
查询频率高，插入删除频率比较低
注意索引会额外的占用磁盘的存储空间，所以还要保证磁盘存储空间足够

② 索引的类型

创建主键约束（PRIMARY KEY）、唯一约束（UNIQUE）、外键约束（FOREIGN KEY）时，会自动创建对应列的索引。
除了上面的主键索引，唯一索引之类的还有普通索引和全文索引：

普通索引：基本的索引类型，没有唯一性的限制，允许值为null
可以通过create index 索引名 on 表名(字段名);或alter table table_name add index index_name(column1, ... columnn);创建索引
【如】:
- 对班级表（classes）中的name创建名为idx_classes_name的索引
  create index idx_classes_name on classes(name)
- alter table classes add index idx_classes_name(name)
全文索引：目前搜索引擎使用的一种关键技术alter table table_name add fulltext (column);
怎么验证 mysql 的索引是否满足需求？
可以通过explain进行查看SQL的执行，查看到SQL执行的相关信息，从而分析索引是否满足需求。
（explain显示了MySQL如何使用索引来处理select语句以及连接表，使用方法：只需要在select语句前加上explain就可以了）

4. 数据库的事务

① 什么是事务

事务指逻辑上的一组操作，组成这组操作的各个单元，要么全部成功，要么全部失败。

②说一下 ACID（事务的四大特性）是什么？

原子性（Atomicity）：整个事务是一个独立的单元，不可分割。要么全部成功，要么全部失败
一致性（Consistency）：执行事务前后，数据保持一致，多个事务对同一个数据读取的结果是相同的
隔离性（Isolation）：并发访问数据库时，一个用户的事务不被其他事物所干扰，各并发事务之间是独立的
持久性（Durability）：一个事务被提交之后，他对数据库中数据的改变是持久的，即使数据库发生故障也不该对其有任何影响

③ 脏读，幻读，不可重复读

这三种都是由于并发访问导致的数据读取问题：

脏读（读取未提交的数据）：事务A更新了一份数据，事务B此时读取了这份数据，但由于一些原因A进行了回滚操作（RollBack），则事务B此时读取的数据就是不正确的
幻读（前后多次读取，数据总量不一致）：事务A在执行读取操作，需要两次统计数据的总量，第一次查询数据总量之后，事务B执行了新增数据的操作并提交，此时事务A读取的数据总量和之前的不一样，就像产生了幻觉一样，平白多出多条数据，所以叫幻读
不可重复读（前后多次读取，数据内容不一致）：事务A第一次读取数据后，事务B执行了更改操作，此时事务A再次读取该数据时发现和第一次读取到的数据不一样了，也就是数据不重复了，系统不可以读到重复的数据了，所以叫不可重复读

④ 事务的隔离级别

MySQL默认采用的隔离级别是可重复读（REPEATABLE_READ）
因为隔离级别越低，事务请求的锁越少，所以大部分数据库系统的隔离级别都是读取已提交(READ_COMMITTED)
事物的隔离级别从低到高依次是：

读取未提交（READ_UNCOMMITTED）:允许读取尚未提交的数据变更，可能会导致脏读，幻读或不可重复读。
读取已提交（READ_COMMITTED）:允许读取并发事务已经提交的数据，可以阻止脏读，但是幻读或不可重复读仍有可能发生。
可重复读（REPEATABLE_READ）：对同一字段的多次读取结果都是一致的，除非数据是被事务自己所修改，可以阻止脏读，不可重复读。
可串行化（SERIALIZABLE）：完全服从ACID的隔离级别。所有事务依次逐个执行，这样事务之间就完全不可能产生干扰，也就是说，可以阻止脏读，幻读，不可重复读

5. mysql 常用的引擎？

在MySQL数据库中，常用的引擎主要是：InnoDB和MyIASM。

一张自增表里面总共有 7 条数据，删除了最后 2 条数据，重启 mysql 数据库，又插入了一条数据，此时 id 是几？
如果创建的表类型是InnoDB，此时新增一条记录不重启数据库的情况下id为8，重启数据库的话id应该为6。因为InnoDB表只把自增主键的最大ID记录到内存中，所以重启数据库或者对表OPTIMIZE操作，都会使最大ID丢失。
如果创建的表类型是MyISAM，那么这条记录的ID就是8。因为MylSAM表会把自增主键的最大ID记录到数据文件里面，重启数据库后，自增主键的最大ID也不会丢失