MySQL索引、事务与存储引擎
索引概念
数据库索引
- 是一个排序的列表,存储着索引值和这个值所对应的物理地址
- 无须对整个表进行扫描,通过物理地址就可以找到所需数据
- 是表中一列或者若干列值排序的方法
- 需要额外的磁盘空间
索引的作用
- 数据库利用各种快速定位技术,能够大大加快查询速率
- 当表很大或查询涉及到多个表时,可以成千上万倍的提高查询速度
- 可以降低数据库的IO成本,并且还可以降低数据库的排序成本
- 通过创建唯一性索引保证数据表数据的唯一性
- 可以加快表与表之间的连接
- 在使用分组和排序时,可大大减少分组和排序时间
索引的分类
- 普通索引
最基本的索引类型,没有唯一性之类
- 唯一性索引
与“普通索引”基本相同
与普通索引的区别是索引列的所有值只能出现一次
- 主键索引
是一种特殊的唯一索引,指定为“primary key”
一个表只能有一个主键,不允许有空值
- 组合索引
可以是单列上创建的索引,也可以是在多列上创建的索引
最左原则,从左往右一次执行
- 全文索引
MySQL从3.23.23版本开始支持全文索引和全文检索
索引类型为fulltext
可以在char、varchar或者text类型的列上创建
创建索引的原则依据
- 表的主键、外键必须有索引
- 记录数超过300行的表应该有索引
- 经常与其他表进行连接的表,在连接字段上应该建立索引
- 唯一性太差的字段不适合建立索引
- 更新太频繁的字段不适合创建索引
- 经常出现的where字句中的字段,特别是大表的字段,应该建立索引
- 索引应该建立在选择性高的字段上
- 索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引
事务的ACID特点
原子性
- 事务是一个完整的操作,事务的各元素是不可分的
- 事务中的所有元素必须作为一个整体提交或回滚
- 如果事务中的任何元素失败,则整个事务将失败 一致性
- 当事务完成时,数据必须处于一致状态
- 在事务开始前,数据库中存储的数据处于一致状态
- 在正在进行的事务中,数据可能处于不一致的状态
- 当事务成功完成时,数据必须再次回到已知的一致状态
隔离性
- 对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应该以任何方式依赖于或影响其他事务
- 修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据
持久性
- 指不管系统是否发生故障,事务处理的结果都是永久的
- 一旦事务被提交,事务的效果会被永久的保留在数据库中
事务控制语句
- MySQL事务默认是自动提交的,当SQL语句提交时事务便自动提交
- 事务控制语句
- BEGIN或START TRANSACTION - COMMIT - ROLLBACK - SAVEPOINT identifier - RELEASE SAVEPOINT identifier - ROLLBACK identifier - SET TRANSACTION
存储引擎概念
MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎
存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式
MySQL常用的存储引擎
MyISAM InnoDB
MySQL数据库中的组件,负责执行实际的数据IO操作
MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储
MyISAM的介绍
- MyISAM不支持事务,也不支持外键
- 访问速度快
- 对事务完整性没有要求
- MyISAM在磁盘上存储成三个文件
- .frm文件存储表定义 - 数据文件的扩展名为.MYD(MYData) - 索引文件的扩展名是.MYI(MYIndex)
表级锁定形式,数据在更新时锁定整个表 数据库在读写过程中相互阻塞
- 会在数据写入的过程阻塞用户数据的读取
- 也会在数据读取的过程中阻塞用户的数据写入
数据单独写入或读取,速度过程较快且占用资源相对少 MyISAM支持的存储格式 静态表、动态表、压缩表
MyISAM适用的生产场景举例
- 公司业务不需要事务的支持
- 单方面读取或写入数据比较多的业务
- MyISAM存储引擎数据读写都比较频繁场景不适合
- 使用读写并发访问相对较低的业务
- 数据修改相对较少的业务
- 对数据业务一致性要求不是非常高的业务
- 服务器硬件资源相对比较差
InnoDB特点介绍
- 支持4个事务隔离级别
- 行级锁定,但是全表扫描仍然会是表级锁定
- 读写阻塞与事务隔离级别相关
- 能非常高效的缓存索引和数据
- 表与主键以簇的方式存储
- 支持分区、表空间,类似oracle数据库
- 支持外键约束,5.5前不支持全文索引,5.5后支持全文索引
- 对硬件资源要求还是比较高的场合
InnoDB适用生产场景分析
- 业务需要事务的支持
- 行级锁定对高并发有很好的适应能力,但需确保查询是通过索引来完成
- 业务数据更新较为频繁的场景:如论坛、微博
- 业务数据一致性要求较高:如银行业务
- 硬件设备内存较大,利用InnoDB较好的缓存能力来提高内存利用率,减少磁盘IO的压力
企业选择存储引擎依据
需要考虑每个存储引擎提供的核心功能及应用场景
支持的字段和数据类型: 所有引擎都支持通用的数据类型 不是所有的引擎都支持其它的字段类型,如二进制对象
锁定类型:不同的存储引擎支持不同级别的锁定: 表锁定 行锁定
索引的支持 建立索引在搜索和恢复数据库中的数据 不同的存储引擎提供不同的制作索引的技术 有些存储引擎根本不支持索引
事务处理的支持 提高在向表中更新和插入信息期间的可靠性 可根据企业业务是否要支持事务选择存储引擎
创建普通索引
用create index命令创建普通索引
show index查看索引
第二种普通索引创建方法
创建唯一索引
创建主键索引
主键索引在创建表的时候就可以直接添加
创建组合索引