理论+实验·MySQL索引、事务与存储引擎
一、索引介绍
1.1 索引的概念
1.1.1 数据库索引
- 是一个排序的列表,存储着索引值和这个值所对应的物理地址
- 无需对整个表进行扫描,通过物理地址就可以找到所需数据
- 是表中以列或者若干列值排序的方法
- 需要额外的磁盘空间
1.2 索引的作用
- 数据库利用各种快速定位技术,能够大大加快查询速率
- 当表很大或查询涉及到多个表时,可以成千上万倍地提高查询速度
- 可以降低数据库的IO(输入输出)成本,并且还可以降低数据库的排序成本
- 通过创建唯一性索引保证数据表数据的唯一性
- 可以加快表与表之间的连接
- 在使用分组和排序时,可大大减少分组和排序时间
1.3 索引的分类
1.3.1 普通索引 index
- 最基本的索引类型,没有唯一性之类的闲置
- 创建普通索引的方式
#1 直接创建
mysql> create index index_name on table_name(column(length));
#2 修改表的方式创建
mysql> alter table table_name add index index_name (column(length));
#3 创建表的时候创建
mysql> create table table_name (id int(3) auto_increment,name varchar(10) not null,score decimal(5,2) not null,address varchar(50) default '未知',primary key(id),==index index_name(id)==);
1.3.2 唯一性索引 unique index
- 与"普通索引"基本相同
- 与普通索引的区别是索引列的所有值只能出现依次,即必须唯一(可以为空,但只能有一个为空)
- 创建唯一索引的方式
#1 直接创建
mysql> create unique index index_name on table_name(某一字段);
#2 修改表的方式创建
mysql> alter table table_name add unique index index_name(某一字段);
#3 创建表的时候创建
mysql> create table table_name (id int(3) not null auto_increment,name varchar(10) not null,score decimal(5,2) not null,address varchar(50) default '未知',primary key(id),unique index index_name(id));
1.3.3 主键索引 primary key
- 是一种特殊的唯一索引,指定为"primary key"
- 一个表只能有一个主键,不允许有空值
- 创建主键索引的方式
mysql> create table table_name (id int(3) not null auto_increment,name varchar(10) not null,==primary key(id)==);
1.3.4 组合索引 单列索引与多列索引
- 可以是单列上创建的索引,也可以是在多列上创建的索引
- 最左原则,从左往右依次执行
- 创建组合索引的方式
mysql> create table table_name (name varchar(10),age int(3),==index index_name(name,age)==);
1.3.5 全文索引 fulltext index
- MySQL从3.23.23版开始支持全文索引和全文检索
- 索引类型为fulltext
- 可以在char、varchar或者text类型的列上创建
#1
mysql> create fulltext index index_name on table_name (column(length));
#2
mysql> alter table table_name add fulltext index index_name (column(length));
#3
mysql> create table table_name (id int(3) not null auto_increment,name varchar(10) not null,score decimal(5,2) not null,address varchar(50) default '未知',primary key(id),==fulltext index index_name(id)==);
1.4 创建索引的原则依据
- 表的主键、外键必须有索引
- 记录数超过300行的表应该有索引
- 经常与其他表进行连接的表,在连接字段上应该建立索引
- 唯一性太差的字段不适应建立索引
- 更新太频繁地字段不适合创建索引
- 经常出现呢在where子句中的字段,特别是大表的字段,应该建立索引
- 索引应该建在选择性高的字段上
- 索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引
1.5 查看索引的方法 show index或show keys
mysql> show index from table_name;
mysql> show keys from table_name;
1.6 删除索引的方法 drop
mysql> drop index index_name on table_name;
mysql> alter table table_name drop index index_name;
1.7 关系型数据的三大范式
1.7.1 第一范式(确保每列保持原子性)
- 第一范式是最基本的范式。如果数据库表中的所有字段值都是不可分解的原子值,就说明该数据库表满足了第一范式。
1.7.2 第二范式(确保表中的每列都和主键相关)
- 第二范式在第一范式的基础之上更进一层。第二范式需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。也就是说在一个数据库表中,一个表中只能保存一种数据,不可以把多种数据保存在同一张数据库表中。
1.7.3 第三范式(确保每列都和主键列直接相关,而不是间接相关)
- 第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。
二、事务介绍 引擎需要innodb
2.1 事务的概念
- 是一种机制、一种操作序列,包含了一组数据库操作命令,并且把所有的命令作为一个整体一起向系统提交或撤销操作请求,即这一组数据库命令要么都执行,要么都不执行
- 是一个不可分割的工作逻辑单元,在数据库系统上执行并发操作时,事务是最小的控制单元
- 适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等
- 通过事务的整体性以保证数据的一致性
2.2 事务的ACID特点
9.1 原子性(Atomicity)
- 事务是一个完整的操作,事务的各元素是不可分的
- 事务中的所有元素必须作为一个整体提交或回滚
- 如果事务中的任何元素失败,则整个事务将失败
9.2 一致性(Consistency)
- 当事务完成时,数据必须处于一致状态
- 在事务开始前,数据库中存储的数据处于一直状态
- 在正在进行的食物中,数据可能处于不一致的状态
- 当事务成功完成时,数据必须再次回到已知的一致状态
9.3 隔离性(Isolation)
- 对数据进行修改的所有并发事务时彼此隔离的,表明事务必须时独立的,它不应以热河方式依赖于或影响其他事务
- 修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据
9.4 持久性(Durability)
- 指不管系统是否发生故障,事务处理的结果都是永久的
- 一旦事务被提交,事务的效果会被永久地保留在数据库中
2.3 事务控制语句
-
MySQL事务默认是自动提交的,当SQL语句提交时事务便自动提交
-
事务控制语句
BEGIN或START TRANSACTION ===>表示事务的开始 COMMIT ===>提交 ROLLBACK ===>回滚 SAVEPOINT 存档点名称 ===>设置断点,存档点 RELEASE SAVEPOINT 存档点名称 ===>释放存档点 ROLLBACK TO 存档点名称 ===>回滚到某个存档点 SET TRANSACTION ===>设置事务
2.4 事务的控制方法
2.4.1 手动对事务进行控制的方法
- 事务处理命令控制事务
begin: 开始一个事务
commit: 提交一个事务
rollback: 回滚一个事务
- 使用set命令进行控制
set autocommit=0: 禁止自动提交
set autocommit=1: 开启自动提交
2.5 事务的操作
innodb的存储引擎才支持事务; 5.7以后都是支持事务的
- 事务处理命令控制事务—1
# 使用test数据库
mysql> use test;
# 创建表,引擎是innodb
mysql> create table test_transaction_test(id int(3))engine=innodb;
# 查看表test_transaction_test的信息
mysql> select * from test_transaction_test;
- 事务处理命令控制事务—2
# 开始事务
mysql> begin;
# 添加记录到表中
mysql> insert into test_transaction_test values (1);
mysql> insert into test_transaction_test values (2);
# 提交事务
mysql> commit;
# 查看表中信息
mysql> select * from test_transaction_test;
- 事务处理命令控制事务—3
# 开始事务
mysql> begin;
# 添加记录到表中
mysql> insert into test_transaction_test values (3);
# 回滚
mysql> rollback;
# 查看表中信息
mysql> select * from test_transaction_test;
三、存储引擎介绍
3.1 存储引擎概念介绍
- MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎
- 存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式
- MySQL常用的存储引擎
MyISAM ===>表级锁定,锁定整张表
InnoDB ===>行级锁定,锁定某一行
- MySQL数据库中的组件,负责执行实际的数据I/O操作
- MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储
3.2 MyISAM的介绍
- MyISAM不支持事务,也不支持外键
- 问速度块
- 对事物完整性没有要求
- MyISAM在磁盘上存储成sane文件
.frm文件存储表定义 ===>表的定义文件
数据文件的扩展名为.MYD(MYData)
索引文件的扩展名是.MYI(MYIndex)
- 表级锁定形式,数据在更新时锁定整个表
- 数据库在读写过程中相互阻塞
会在数据写入的过程阻塞用户数据的读取
也会在数据读取的过程中阻塞用户的数据写入
- 数据单独写入或读取,速度过程较快且占用资源相对少
- MyISAM支持的存储格式
静态表
动态表
压缩表
3.3 MyISAM适用的生产场景举例
- 公司业务不需要事务的支持
- 单方面读取或写入数据比较多的业务
- MyISAM存储引擎数据读写都比较频繁场景不适合
- 使用读写并发访问相对低的业务
- 数据修改相对较少的 业务
- 对数据业务一致性要求不是非常高的业务
- 服务器硬件资源相对比较差
3.4 InnoDB特点介绍
- 支持4个事务隔离级别
- 行级锁定,但是全表扫描任然会是表级锁定 ===>读写分离
- 读写阻塞与事务隔离级别相关
- 能非常高效的缓存索引和数据
- 表与主键以族的方式存储
- 支持分区、表空间,类似oracle数据库
- 支持外键约束 ===>版本5.5前不支持全文索引,版本5.5后支持去哪问索引
- 对硬件资源要求还是比较高的场合
3.5 InnoDB适用生产场景分析
- 业务需要事务的支持
- 行级锁定对高并发有很好的适应能力,但需确保查询是通过索引来完成
- 业务数据更新较为频繁的场景
如:论坛、微博等
- 业务数据一致性要求较高
如:银行业务
- 硬件设备内存较大,利用innodb较好的缓存能力来提高内存利用率,减少磁盘I/O的压力
3.6 企业选择存储引擎依据
- 需要考虑每个存储引擎提供的核心功能级应用场景
- 支持的字段和数据类型
但所有引擎都支持通用的数据类型
但不是所有的引擎都支持其它的字段类型,如二进制对象
- 锁定类型:不同的存储引擎支持不同级别的锁定
表锁定
行锁定
- 索引的支持
简历索引在搜索和恢复数据库中的数据时能显著提高性能
不同的存储引擎提供不同的制作索引技术
有些存储引擎根本不支持索引
- 事务处理的支持
提高在向表中更新和插入信息期间的可靠性
可根据企业业务是否要支持和事务选择存储引擎
3.7 修改存储引擎
- 方法一、alter table 修改
alter table table_name engine=引擎;
- 方法二、修改my.cnf, 指定默认存储引擎并重启服务
default-storage-engine=引擎;
- 方法三、create table创建表时指定存储引擎
create table table_name (字段) engine=引擎;