MySQL使用原则:
自己扛住的自己扛,扛不住的使用中间件,比如:Redis;
最佳的单表存储量是千万级别,超过这个级别采取分表分布的方式来存储表。
MySQL体系架构
MySQL语句在数据库的执行过程:
经过parser进行词法解析和语法解析;
解析之后经过优化器生成执行计划,MySQL不缓存执行计划(也叫做硬解析);
执行计划进入执行器执行,到存储引擎中找数据;
返回数据。
MySQL包括核心层(mysqld)和存储引擎层,前者在内存和CPU中执行,后者在硬盘中,指的是不同的存储方法,最主要的两种是InnoDB和MyISAM
MySQL一次读取数据为16K,每个16K叫做page(页),
InnoDB
包括主键索引和辅助索引(又叫K值索引,二级索引),主键索引的叶子节点存放的就是记录,辅助键索引叶子结点存放的是索引字段和主键,通过索引字段查找对应的记录,根据该记录中的主键去主键索引找对应的记录。
建表时,如果没有声明主键,InnoDB会通过第一个非空且唯一的字段建立主索引,没有的话,会建立隐藏列(6字节)。
索引是一颗B+树,所有的叶子节点是一个双向链表,在插入数据维护索引时,可能会出现页分裂的情况。
根据辅助索引查询数据时,如果需要查询除主键索引外的数据,那么需要回表(辅助索引到主键索引的过程),但是如果只查找主键,就不需要回表。
联合索引
多个字段联合建立索引。
最左前缀原则
当你定义了联合索引时,在执行查找时,只有where字句出现的字段与联合索引出现的顺序一致,才能使用上索引。
支持事务。
表在存储引擎中被存放到两个文件,.idb文件存放的实际数据,.frm文件存放的是表的定义,由于系统中文件大小有限制,因此表存储的数据量有限制。
innodb buffer pool - 数据和索引都能缓存,MyISAM只能缓存索引。
MySQL查询数据时取表中16K的数据放到Innodb buffer pool做查询,满足查询条件的数据留下,继续扫描直到扫描了全表,同时,也存储了索引。
相关参数:
innodb_buffer_pool_size - innodb buffer pool在内存里的大小;
innodb_buffer_pool_instance - innodb buffer pool被分为几块,一般设置成16或者32。
innodb buffer pool使用LRU(Least Recent Used,最近最少使用)算法存储缓存在内存中的数据,默认页的大小是16K。
查询机制:
如果要查询到数据所在页不在Buffer Pool中,把该页从磁盘加载到Buffer Pool中的缓存页时,将该缓存页包装成节点塞到链表的头部;
如果该页在Buffer pool中,则直接把该页对应的LRU链表节点移动到链表的头部。
LRU链的前半部分称为热端,后半部分称为冷端。
缓存页直接放在热端带来的问题是,访问极少使用的表后,对应的页会放置在热端,造成原本频繁访问的数据被淘汰,后期再访问时存在大量磁盘IO,因此为了优化这一问题,在LRU中设置了midpoint,默认情况下新缓存页第一次插入到LRU列表的5/8处,再次查询时再放到LRU链表头部。
update机制
事务:对数据做修改,以commit或者rollback结束的过程。
假设当前有个用户对某条数据进行更新,执行如下语句:update emp set name=JACK where empno=7369;,随后又来一个用户读取同一条数据,select * form emp where empno=7369;,数据库默认不执行commit,其流程如下:
读线程io_