项目笔记总结-Mysql

最新推荐文章于 2024-07-05 11:11:30 发布

不知名社会人

最新推荐文章于 2024-07-05 11:11:30 发布

阅读量922

点赞数

分类专栏：笔记文章标签： mysql 数据库

本文链接：https://blog.csdn.net/weixin_54236608/article/details/125831902

版权

本文深入探讨了MySQL的索引原理，包括B+树结构、索引类型（如聚簇与非聚簇索引）、索引的优缺点、回表与索引覆盖。此外，还讲解了如何避免回表、最左匹配原则、索引下推优化以及如何在海量数据中快速查询。同时，文章提到了主键选择自增ID而非UUID的原因，以及SQL优化、事务隔离级别、MVCC机制、锁的使用和存储引擎的选择场景。

摘要由CSDN通过智能技术生成

Mysql

1、索引

索引->数据结构(B+,hash)，设计原则，优化，失效，回表，索引覆盖，最左匹配，索引下推，聚簇索引
集群：主从复制，读写分离，分库分表
sql优化，存储引擎，事务，锁，MVCC，日志，
mysql的架构体系：存储引擎才是实际存储数据的地方
分库，分表用sharding-sphere(归属于apache了)和mycat(了解即可)
explain+sql语句可以查看执行计划，sql语句的执行效率如何，在那块可以做索引优化

根据ID，看执行优先级

select_type：simple是简单查询，primary是复杂查询

type类型：system>const>ref>range>index>all

key:查看使用的索引

type

const->表中有匹配行select * from emp where name=12

eq_ref->唯一索引做数据查找select * from emp,emp2 where emp.empno=emp2.empno

ref->非唯一索引做数据查找select * from dept,emp where dept.deptno=emp.deptno

range->索引做范围查找select * from emp where empno=12

index->索引做全表扫描select empno from emp;

all->直接暴力的全表扫描select * from emp;

2、索引存储的格式是key,value (key表示索引字段，value表示行记录)

1.数据在磁盘上，他寻址的速度是微妙，内存的寻址速度是纳秒，查了十万八千倍
数据存储在磁盘上，如果数据量很大，无法全部一次读取内存，(内存的处理效率明显是高于磁盘的)就需要批量加载，分块去读，就需用用IO读，那么减少IO读取量，减少IO读取次数，就会提高效率
2. 那么怎么存就会让查询读的效率更高？那就看使用怎样的数据结构了
2. 为什么使用哈希呢？当哈希算法不友好的话，就导致数据散列不均匀，哈希碰撞之类的，而且无法范围查找时，效率很低
3. 普通的什么二叉树，平衡二叉树红黑树(有序，平衡)他们都是有且只有两个结点，当数据很多时，就会导致这个树很深，就表示IO读取的次数会很多，从硬盘到内存读数据时，效率就底，所以就是用B+树：
1. 第一是为了降低树的深度
2. 第二是将结点上的单个数据变成多个区间，区间越多，检索效率就越高
3. 非叶子结点存储key值（字段名），叶子结点存储key和值,IO读取量减少
4. 而且叶子结点之间通过指针相互连接，基于索引的顺序扫描，指针左右快速左右移动，效率很高

3、B+树他是多少层

一般情况下，3到4层的B+数，足以支持千万级别的数据量存储

4、在数据库中选择索引或者key值的时候，使用的是int类型还是varchar类型的

我们要让key尽可能少的占用数据空间
当varchar(数字)当数字小于4时，使用int,反之用varchar

5、聚簇索引和非聚簇索引

聚簇索引：数据和索引存储在一起的，存储引擎是innodb的，数据必须和某个索引绑定在一起，绑定数据的索引(主键->唯一索引->6字节的rowid这是MVCC里的隐藏的主键，用户不可见)是聚簇索引，那其他索引的叶子结点中存储的数据不再是整行记录，而是对应的聚簇索引的主键的key值(如果ID是主键，放的就是1，2…)，这些就是非聚簇索引
非聚簇索引：数据和索引没有存在一起，存储引擎是myisam的，
所以：innodb既有聚簇索引，又有非聚簇索引；myisam中只有非聚簇索引