1. 数据库的三范式是什么?
- 第一范式:保证每个字段的原子性,不可拆分。
- 第二范式:确保表中的每列都和主键相关
- 第三范式:非主键列之间没有传递函数依赖关系(确保每列都和主键列直接相关,而不是间接相关)
2. 数据库的数据类型
① 数值类型
数据类型 | 大小 | 说明 | 对应的java类型 |
---|---|---|---|
BIT[M] | M指定位数,默认为1 | 二进制数,M范围从1-64,存储数值范围从0到2^M-1 | 常用Boolean类型对应BIT,此时默认是1位,也就是只能存0和1 |
TINYINT | 1字节 | Byte | |
SMALLINT | 2字节 | Short | |
INT | 4字节 | Integer | |
BIGINT | 8字节 | Long | |
FLOAT(M,D) | 4字节 | 单精度浮点数,M指定长度,D指定小数位数,会发生精度丢失 | Float |
DOUBLE(M,D) | 8字节 | Double | |
DECIMAL(M,D) | M/D最大值+2 | 双精度,M指定长度,D指定小数位数,精确数值 | BigDecimal |
NUMERIC(M,D) | M/D最大值+2 | 和DECIMAL一样 | BigDecimal |
- float ,double ,decimal
decimal可以用来存比bigint还大的整形,能存储精确的数值
而float和double有取值范围
计算时float和double比decimal效率更高
② 字符串类型
数据类型 | 说明 | 对应的java类型 |
---|---|---|
CHAR | 定长字符串 | String |
VARCHAR(SIZE) | 可变长度字符串 | String |
TEXT | 长文本数据 | String |
MEDIUMTEXT | 中等长度文本数据 | String |
BLOB | 二进制形式的长文本数据 | byte[] |
- char 和 varchar 的区别是什么?
char是定长字符串,varchar是可变长度字符串,后者比前者更节省空间
char中如果插入数据长度小于char的固定长度时,则用空格填充;varchar插入数据是多长,就按多长来存储
char由于长度固定,所以存取速度高于varchar,占用空间也会大于varchar;varchar刚好相反,存取速度慢,占用空间小
对于经常变更的值,建议用char,因为他不易产生碎片
对于比较短的列,char比varchar在存储空间上更有效率 - varchar(50) 中的50是什么意思?
表示最多存放50个字符,varchar(50)和varchar(200)存储同一个字符所占空间都是一样的,但是varchar(200)会比(50)消耗内存多一些 - int(10) ,char(10),varchar(10)
int(10)中的10表示显示的数据的长度,而不是存储数据的大小
char(10)和varchar(10)表示存储数据的大小,也就是存储多少个字符
char(10)表示存储10个字符,不足10个用空格补齐
varchar(10)表示存储10个变长字符,字符有几个就是几个,不足10个就不足10个 - 注意要尽量避免使用TEXT或BLOB类型,因为查询的时候会使用临时表,导致严重的性能开销
③ 日期类型
数据类型 | 大小 | 说明 | 对应的java类型 |
---|---|---|---|
DATETIME | 8字节 | 范围从1000年-9999年,不会进行时区的检索和转换 | java.util.Data , java.sql.Timestamp |
TIMESTAMP | 4字节 | 范围从1970年-2038年,自动检索当前时区并进行转换 | java.util.Data , java.sql.Timestamp |
- 尽量使用TIMESTAMP,空间效率效率会比DATETIME高
3. 数据库的索引
① 什么是索引
- 索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。
- 索引是一种数据结构,他通常使用B树,B+树,hash实现。
- 优点:索引就相当于目录,可以快速定位,检索数据,对数据库性能的提高有很大帮助。
- 缺点:由于索引是一种文件,是要占据一定的物理空间的;并且创建和维护索引要耗费时间(当对数据库表中数据增删改的时候,索引也要动态维护,会降低增删改的执行效率)
② 索引的使用场景
当满足以下条件时,考虑对表中的某列或某几列创建索引,以提高查询效率:
- 数据量特别大,平常的查询此时比较耗时
- 查询频率高,插入删除频率比较低
- 注意索引会额外的占用磁盘的存储空间,所以还要保证磁盘存储空间足够
② 索引的类型
创建主键约束(PRIMARY KEY)、唯一约束(UNIQUE)、外键约束(FOREIGN KEY)时,会自动创建对应列的索引。
除了上面的主键索引,唯一索引之类的还有普通索引和全文索引:
-
普通索引:基本的索引类型,没有唯一性的限制,允许值为null
可以通过create index 索引名 on 表名(字段名);
或alter table table_name add index index_name(column1, ... columnn);
创建索引
【如】:- 对班级表(classes)中的name创建名为idx_classes_name的索引
create index idx_classes_name on classes(name)
alter table classes add index idx_classes_name(name)
- 对班级表(classes)中的name创建名为idx_classes_name的索引
-
全文索引:目前搜索引擎使用的一种关键技术
alter table table_name add fulltext (column);
-
怎么验证 mysql 的索引是否满足需求?
可以通过explain进行查看SQL的执行,查看到SQL执行的相关信息,从而分析索引是否满足需求。
(explain显示了MySQL如何使用索引来处理select语句以及连接表,使用方法:只需要在select语句前加上explain就可以了)
4. 数据库的事务
① 什么是事务
事务指逻辑上的一组操作,组成这组操作的各个单元,要么全部成功,要么全部失败。
②说一下 ACID(事务的四大特性) 是什么?
- 原子性(Atomicity):整个事务是一个独立的单元,不可分割。要么全部成功,要么全部失败
- 一致性(Consistency):执行事务前后,数据保持一致,多个事务对同一个数据读取的结果是相同的
- 隔离性(Isolation):并发访问数据库时,一个用户的事务不被其他事物所干扰,各并发事务之间是独立的
- 持久性(Durability):一个事务被提交之后,他对数据库中数据的改变是持久的,即使数据库发生故障也不该对其有任何影响
③ 脏读,幻读,不可重复读
这三种都是由于并发访问导致的数据读取问题:
- 脏读(读取未提交的数据):事务A更新了一份数据,事务B此时读取了这份数据,但由于一些原因A进行了回滚操作(RollBack),则事务B此时读取的数据就是不正确的
- 幻读(前后多次读取,数据总量不一致):事务A在执行读取操作,需要两次统计数据的总量,第一次查询数据总量之后,事务B执行了新增数据的操作并提交,此时事务A读取的数据总量和之前的不一样,就像产生了幻觉一样,平白多出多条数据,所以叫幻读
- 不可重复读(前后多次读取,数据内容不一致):事务A第一次读取数据后,事务B执行了更改操作,此时事务A再次读取该数据时发现和第一次读取到的数据不一样了,也就是数据不重复了,系统不可以读到重复的数据了,所以叫不可重复读
④ 事务的隔离级别
MySQL默认采用的隔离级别是可重复读(REPEATABLE_READ)
因为隔离级别越低,事务请求的锁越少,所以大部分数据库系统的隔离级别都是读取已提交(READ_COMMITTED)
事物的隔离级别从低到高依次是:
- 读取未提交(READ_UNCOMMITTED):允许读取尚未提交的数据变更,可能会导致脏读,幻读或不可重复读。
- 读取已提交(READ_COMMITTED):允许读取并发事务已经提交的数据,可以阻止脏读,但是幻读或不可重复读仍有可能发生。
- 可重复读(REPEATABLE_READ):对同一字段的多次读取结果都是一致的,除非数据是被事务自己所修改,可以阻止脏读,不可重复读。
- 可串行化(SERIALIZABLE):完全服从ACID的隔离级别。所有事务依次逐个执行,这样事务之间就完全不可能产生干扰,也就是说,可以阻止脏读,幻读,不可重复读
5. mysql 常用的引擎?
在MySQL数据库中,常用的引擎主要是:InnoDB和MyIASM。
- 一张自增表里面总共有 7 条数据,删除了最后 2 条数据,重启 mysql 数据库,又插入了一条数据,此时 id 是几?
如果创建的表类型是InnoDB,此时新增一条记录不重启数据库的情况下id为8,重启数据库的话id应该为6。因为InnoDB表只把自增主键的最大ID记录到内存中,所以重启数据库或者对表OPTIMIZE操作,都会使最大ID丢失。
如果创建的表类型是MyISAM,那么这条记录的ID就是8。因为MylSAM表会把自增主键的最大ID记录到数据文件里面,重启数据库后,自增主键的最大ID也不会丢失