1.MyISAM和InnoDB区别:
2.SQL加载顺序:
1.from: 指那一张表
2.on: 指两个表的连接
3.join: 左右链接
4.where: 查询条件
5.goup by: 分组
6.having: 对分组后的条件
7.select: 查询
8.distinct: 返回唯一的值(去重)
9.order by: 排序
10.limit: 范围
3.索引:
索引是帮助MySQL高效获取数据的数据结构。
可以得到索引的本质:索引是数据结构。
可以理解为:排好序的快速查找数据结构。
索引有两大功能:排好序,查找快。
索引分类:
1.单值索引:即一个索引只包含单个列,一个表可以有多个单列索引
2.唯一索引:索引列的值必须唯一,但允许有空值
3.复合索引:即一个索引包含多个列
哪些情况需要建立索引:
1.主键自动建立唯一索引。
2.频繁作为查询条件的字段应该创建索引。
3.查询中与其他表关联的字段,外键关系建立索引。
4.where条件里用不到的字段不创建索引。
5.查询中排序的字段,排序字段若通过索引去访问将大大提升排序速度。
6.查询中统计或分组字段。
哪些情况不需要建立索引:
1.表记录太少。
2.经常增删改的表。
3.数据重复且分布平均的表字段。
那些情况索引会失效:
1.全值匹配我最爱。
2.最佳左前缀法则。
3.不在索引列上做任何操作(计算,函数,类型转换),会导致索引失效而转向全表扫描。
4.存储引擎不能使用索引中范围条件右边的列。
5.尽量使用覆盖索引(只访问索引的查询(索引列和查询列一致)),减少select *。
6.mysql在使用不等于(!= 或者<>)的时候无法使用索引会导致全表扫描。
7.is null ,is not null 也无法使用索引。
8.like以通配符开头 ,mysql索引失效会变成全表扫描的操作。
9.字符串不加单引号索引失效。
10.少用or,用它来连接时会索引失效。
11.永远小表驱动大表(小表驱动大表时用in, 大表驱动小表用exists )
4.explain字段解释:
id:select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序。
三种情况:
1:id相同,执行顺序由上至下。
2:id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行。
3:id相同不同,同时存在。
select_type:查询的类型,主要是用于区别普通查询,联合查询,子查询等复杂查询。
1:SIMPLE:简单的select查询,查询中不包含子查询或者UNION
2:PRIMARY:查询中若包含任何复杂的子部分,最外层查询则被标记为PRIMARY
3:SUBQUERY:在select或where列表中包含了子查询
4:DERIVED:在from列表中包含的子查询被标记位DERIVED(衍生),mysql会递归执行这些子查询,把结果集放在临时表里。
5:UNION:若第二个select出现在UNION之后,则被标记为UNION;若UNION包含在from子句的子查询中,外层select将被标记为:DERIVED。
6:UNION RESULT:从UNION表获取结果的select。
type:
1.显示查询使用了何种类型,从最好到最差依次是:
system>const>eq_ref>ref>range>index>ALL
possible_keys:
1.显示可能应用在这张表中的索引,一个或多个。
2.查询涉及到的字段上若存在索引,则该索引将呗列出,但不一定被查询实际使用。
key:
1.实际使用的索引。如果位null,则没有使用索引。
2.查询中若使用了覆盖索引,则该索引仅出现在key列表中。
key_len:
1.表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损精确性的情况下,长度越短越好。
2.key_len 显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的。
ref:
1.显示索引的那一列被使用了,如果可能的话,是一个常数。
rows:
1.根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数。
Extra:
包含不适合在其他列中显示但十分重要的额外信息。
1.Using filesort:说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。 mysql中无法利用索引完成的排序操作成为”文件排序“。
2.Using temporary:使用了临时表保存中间结果,mysql在对查询结果排序时使用临时表。常见于排序order by和分组查询group by 。
3.Using index:表示相应的select操作中使用了覆盖索引,避免访问了表的数据行,效率不错!
如果同时出现using where,表明索引被用来执行索引键值的查找。
如果没有同时出现using where,表明索引用来读取数据而非执行查找动作。
4.using where :表明使用了where过滤
5.using join buffer: 使用了连接缓存
6.impossible where :where子句的值总是false,不能用来获取任何元组。
5.事务与锁的概念:
事务4个属性:
1.原子性:事务时一个原子操作单元,其对数据的修改,要么全都执行,要么全都不执行。
2.一致性:在事务开始和完成时,数据都必须保持一致状态。
3.隔离性:数据库系统提供一定的隔离机制,保证事务在不受外部并发操作影响的”独立“环境执行。
4.持久性:事务完成之后,它对数据的修改是永久性的,即使出现系统故障也能够保持。
事务的四种隔离级别:
1:读未提交:就是一个事务可以读取另一个未提交事务的数据。
2:读已提交:就是一个事务要等另一个事务提交后才能读取数据。
3:可重复读:就是在开始读取数据(事务开启)时,不再允许修改操作。
4:序列化:是最高的事务隔离级别,在该级别下,事务串行化顺序执行,可以避免脏读.不可重复读与幻读。但是这种事务隔离级别效率低下,比较耗数据库性能,一般不使用。
锁:
1.表锁:操作时,会锁定整个表。
2.行锁:操作时,会锁定当前操作行。
3.读锁(共享锁):针对同一份数据,多个读操作可以同时进行而不会相互影响。
4.写锁(排它锁):当前操作没有完成之前,它会阻断其他写锁和读锁。
5.InnoDB与MyISAM的最大不同有两点:一是支持事务,二是采用了行级锁。
6.如果不通过索引条件检索数据,那么InnoDB将对表中的所有记录加锁,实际效果跟表锁一样。
6.mysql底层数据结构及原理:
mysql底层采用B+Tree(BTree的变种)
1.非叶子节点不存储data,只存储索引(冗余),因为可以放更多的索引
2.叶子节点包含所有索引字段。
3.叶子节点用指针连接,提高区间访问的性能。
4.如果是非主键索引,叶子节点存储的是主键值
B树和B+树的区别为:
1.B+Tree的叶子节点保存所有的key信息,key大小顺序排序
2.所有的非叶子节点都是key的索引部分
B+树的结构图:
页的概念:(每一个页目录中 都存放一行的数据)
mysql 内存:
1.Buffer Pool :在mysql启动是开辟一块内存空间,大小为128M
2.free链表:记录Buffer Pool 内存区空闲的位置。每当从磁盘复制数据到Buffer Pool中时,会根据free链表纪录的空闲位置去存放到Buffer Pool 内存中,并删除free列表对应的控制块。
3.flush链表:纪录Buffer Pool中脏页(指的是被修改后的页)每一个控制块代表一个脏页。会有线程定期去查询flush链表把脏页数据持久化到磁盘。
4.lru链表:每一个控制块对应是Buffer Pool 中的页,只要是更新或者查询操作,页对应的控制块就会排到第一个,所以lru中的控制块越靠前则说明是热数据。
其中八分之五 存储的是热数据区,八分之三存储的是冷数据区,从磁盘读取来的数据 会先放到冷数据区,如果第二次访问的时候 超过1秒则会放入到热数据区(防止换血情况的一种机制)。
1.redo log:持久化数据到磁盘(默认事物提交 就立即持久化)。
2.bin log:记录的是sql语句(除了查询都记录),而redo log 不同的是 记录着 数据更改的信息(如果 id=9的数据 name字段改成 666),
所以对比效率而言redo log 会更快一些。主要用于记录数据恢复,或者主从复制。
3.undo log :反向操作, 事物回滚时 用到。(mvcc 就是靠这个来实现的)
4.mvcc :select * from t1 where id=18;readview[200,300](纪录着活跃事物id)
会根据undo log中记录的数据 找到最开始的值