Mysql 存储引擎

        MySQL提供了多种存储引擎来管理不同类型的表,每种存储引擎都有其特定的特性和用途。

1.存储引擎:

        (1). InnoDB

  • 特点:支持事务(ACID)、行级锁定、外键约束。
  • 用途:适用于高可靠性和高并发的事务型应用,例如金融系统、ERP系统等。
  • 优点
    • 支持事务和外键,保证数据完整性。
    • 高效的行级锁,适合高并发的写操作。
    • 支持崩溃恢复。
  • 缺点:读性能相对MyISAM略差,尤其是在复杂查询时。

        (2).MyISAM

  • 特点:不支持事务和外键,支持表级锁定,查询速度较快。
  • 用途:适用于读多写少的场景,例如数据仓库、分析系统等。
  • 优点
    • 查询速度快,适合读取密集型操作。
    • 表的存储格式简单,支持全文索引。
    • 占用空间相对较小。
  • 缺点
    • 不支持事务和外键,数据完整性和安全性较差。
    • 使用表级锁,写操作并发性低。

       (3). MEMORY

  • 特点:数据存储在内存中,速度极快,数据非持久化。
  • 用途:适用于临时表、缓存表和对性能要求极高的读操作。
  • 优点
    • 读写速度非常快。
    • 支持HASH索引,适合快速查找。
  • 缺点
    • 数据不持久化,服务器重启后数据丢失。
    • 表大小受可用内存限制,无法存储大量数据。

       (4).CSV        

  • 特点:每个表对应一个CSV文件,数据以逗号分隔,适合数据交换。
  • 用途:适用于需要将数据导入导出的场景。
  • 优点
    • 表结构和数据文件简单易于读取和编辑。
  • 缺点
    • 不支持索引、事务、外键等高级特性。
    • 查询性能差。

        (5).ARCHIVE

  • 特点:用于存储大量的归档数据,支持高压缩比,只有插入和查询操作,不支持删除和更新。
  • 用途:适合需要存储大量历史归档数据的场景,如日志记录。
  • 优点
    • 高度压缩,节省存储空间。
    • 插入操作非常快。
  • 缺点
    • 不支持事务和索引。
    • 不支持删除和更新。

        (6).NDB Cluster (MySQL Cluster)

  • 特点:分布式存储引擎,适用于MySQL Cluster,支持高可用性和自动分片。
  • 用途:适用于需要高可用性和低延迟的分布式应用。
  • 优点
    • 高可用性和冗余。
    • 自动分片和数据复制。
  • 缺点
    • 配置复杂,管理难度较高。
    • 高速网络要求高。

       (6).Federated

  • 特点:提供访问远程MySQL数据库表的方式,不存储数据。
  • 用途:适合需要在多个MySQL服务器之间分布数据的场景。
  • 优点
    • 实现分布式数据存储。
  • 缺点
    • 不支持事务和外键。
    • 由于远程连接,查询性能较低。

       (7).BLACKHOLE

  • 特点:数据插入时被丢弃,不存储实际数据,支持事务。
  • 用途:适合需要测试或记录日志(如复制)但不需要存储数据的场景。
  • 优点
    • 插入速度非常快,因为不存储任何数据。
  • 缺点
    • 不存储数据,仅作为“黑洞”使用。

2.如何选择合适的存储引擎?

  • 高并发和事务支持:选择InnoDB。
  • 读多写少,且对事务和外键无要求:选择MyISAM。
  • 高性能临时表或缓存表:选择MEMORY。
  • 数据归档或日志存储:选择ARCHIVE。
  • 分布式高可用架构:选择NDB Cluster。
  • 远程表访问:选择Federated。

        存储引擎的选择应根据具体的应用场景、数据量、读写比、事务需求和备份恢复策略等因素来综合考虑。

3.Innodb的底层实现:

        InnoDB是MySQL的默认存储引擎,具有高可靠性和高性能,支持事务处理、行级锁定和外键约束。InnoDB的底层实现非常复杂,包括了存储结构、事务机制、锁机制、缓存机制等多个方面。

        (1).数据存储结构

        InnoDB使用B+树来存储数据,并且采用聚簇索引(Clustered Index)方式。

  • 聚簇索引(Clustered Index):在InnoDB中,表数据按照主键顺序存储,主键索引(聚簇索引)和表数据是存储在一起的。每张表必须有一个聚簇索引,如果没有定义主键,InnoDB会选择一个唯一非空索引作为聚簇索引,否则会自动创建一个隐藏的主键。
  • 辅助索引(Secondary Index):辅助索引叶节点存储的是主键的值,因此查找辅助索引时需要先查到主键,再根据主键去聚簇索引查找数据(回表操作)。

        (2).页结构和索引

        InnoDB将存储空间分成称为“页”(Page)的最小存储单元,每个页的默认大小为16KB。InnoDB中的页类型主要有数据页、索引页、Undo页、系统页等。

  • 页的管理:InnoDB使用称为“段(Segment)”、“区(Extent)”和“页(Page)”的结构来管理数据。
    • 页(Page):数据存储的基本单位,一个页通常大小为16KB。
    • 区(Extent):一个区由连续的64个页组成,大小为1MB。
    • 段(Segment):段是由多个区组成的,可以认为段是逻辑概念上的一个表或索引。

        (3).数据页结构

        一个数据页存储了多个行数据,并且每个页的结构通常包括以下部分:

  • 页头(Page Header):存储页的基本信息,如页类型、页大小等。
  • 用户记录(User Records):存储实际的数据行。
  • 页目录(Page Directory):用于快速定位用户记录。
  • 页尾(Page Trailer):用于检验页的完整性,防止数据被破坏。

        (4).InnoDB的缓冲池(Buffer Pool)

        InnoDB将大部分数据(索引和数据)缓存到内存中,以减少磁盘I/O操作。这个内存区域被称为缓冲池(Buffer Pool)。

  • Buffer Pool:Buffer Pool用来缓存数据页和索引页,是InnoDB性能优化的关键组件。通过Buffer Pool,InnoDB能够将频繁访问的页面保存在内存中,减少对磁盘的访问。
  • LRU算法:InnoDB使用LRU(Least Recently Used)算法来管理Buffer Pool中的页面,确保最近最少使用的页面先被淘汰。

        (5).事务与日志系统

        InnoDB通过重做日志(Redo Log)和回滚日志(Undo Log)来实现事务的ACID特性:

  • Redo Log(重做日志):记录数据的物理修改,用于事务的恢复。Redo Log是WAL(Write-Ahead Logging)机制的一部分,即先写日志再写磁盘。当系统崩溃时,Redo Log可用于恢复未完成的事务。
  • Undo Log(回滚日志):用于实现事务的回滚(Rollback)和MVCC(多版本并发控制)。Undo Log记录数据修改前的状态,当需要回滚时可以使用它来还原数据。

        (6).MVCC(多版本并发控制)

        InnoDB通过MVCC来实现高效的并发控制,避免了加锁的开销。MVCC通过维护每行数据的多个版本,实现了快照读和一致性读:

  • ReadView:在读取操作开始时,InnoDB会创建一个ReadView,确保读取到的是一个一致性视图,避免读取到其他事务正在修改的数据。
  • 事务版本链:每行数据都维护了多个版本,通过指向Undo Log的指针可以找到该行数据的历史版本。

        (7).锁机制

        InnoDB实现了行级锁定机制,主要包括共享锁(S锁)和排它锁(X锁),以及多粒度锁定的意向锁(Intent Lock)。

  • 行锁(Row Lock):锁定单个行,支持高并发。
  • 表锁(Table Lock):锁定整个表,锁的粒度较大,影响并发性能。
  • 意向锁(Intention Lock):用来表示事务想要对表中某些行加锁,分为意向共享锁(IS)和意向排它锁(IX)。

        (8).崩溃恢复

        InnoDB通过重做日志和检查点机制实现崩溃恢复。当系统崩溃时,InnoDB会根据Redo Log来恢复已提交但还未持久化的数据。回滚未提交的事务则使用Undo Log。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值