mysql索引，分库分表，主从同步

最新推荐文章于 2022-05-14 16:57:43 发布

败毒

最新推荐文章于 2022-05-14 16:57:43 发布

阅读量629

点赞数

分类专栏：数据库

本文链接：https://blog.csdn.net/Afra_bd/article/details/100861775

版权

数据库专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1.mysql索引类型

索引类型

1、B+树索引(O(log(n)))

2、hash索引：
a 仅仅能满足"=",“IN"和”<=>"查询，不能使用范围查询
b 其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引
c 只有Memory存储引擎显示支持hash索引

3、FULLTEXT索引（现在MyISAM和InnoDB引擎都支持了），类似于搜索引擎，可以进行分词，提高文本检索效率

4、R-Tree索引（用于对GIS数据类型创建SPATIAL索引）

索引种类

普通索引：仅加速查询
唯一索引：加速查询 + 列值唯一（可以有null）
主键索引：加速查询 + 列值唯一（不可以有null）+ 表中只有一个
组合索引：多列值组成一个索引，专门用于组合搜索，其效率大于索引合并
全文索引：对文本的内容进行分词，进行搜索

2.数据库分库分表策略

1、根据数值范围

2、根据数值取模

3、根据地区范围（华北、华东。。。）

4、根据时间范围（月份，年份。。。）

分库分表带来的问题

1、事务一致性问题

当更新内容同时分布在不同库中，不可避免会带来跨库事务问题。跨分片事务也是分布式事务，没有简单的方案，一般可使用"XA协议"和"两阶段提交"处理。

2、跨节点关联查询 join 问题

切分之前，系统中很多列表和详情页所需的数据可以通过sql join来完成。而切分之后，数据可能分布在不同的节点上，此时join带来的问题就比较麻烦了，考虑到性能，尽量避免使用join查询。

3、跨节点分页、排序、函数问题

跨节点多库进行查询时，会出现limit分页、order by排序等问题。分页需要按照指定字段进行排序，当排序字段就是分片字段时，通过分片规则就比较容易定位到指定的分片；当排序字段非分片字段时，就变得比较复杂了。需要先在不同的分片节点中将数据进行排序并返回，然后将不同分片返回的结果集进行汇总和再次排序，最终返回给用户。

4、全局主键避重问题

在分库分表环境中，由于表中数据同时存在不同数据库中，主键值平时使用的自增长将无用武之地，某个分区数据库自生成的ID无法保证全局唯一。因此需要单独设计全局主键，以避免跨库主键重复问题。

5、数据迁移、扩容问题

当业务高速发展，面临性能和存储的瓶颈时，才会考虑分片设计，此时就不可避免的需要考虑历史数据迁移的问题。一般做法是先读出历史数据，然后按指定的分片规则再将数据写入到各个分片节点中。此外还需要根据当前的数据量和QPS，以及业务发展的速度，进行容量规划，推算出大概需要多少分片（一般建议单个分片上的单表数据量不超过1000W）

如果采用数值范围分片，只需要添加节点就可以进行扩容了，不需要对分片数据迁移。如果采用的是数值取模分片，则考虑后期的扩容问题就相对比较麻烦。

参考：https://www.cnblogs.com/butterfly100/p/9034281.html

3.mysql主从同步原理

主从同步过程中主服务器有一个工作线程I/O dump thread，从服务器有两个工作线程I/O thread和SQL thread。

首先MySQL主库在事务提交的时候会把数据变更作为Events记录在二进制文件Binlog中。

1.I/O dump 线程:每当有从库连接到主库的时候，主库都会创建一个I/O dump 线程，然后发送binlog内容到从库。在从库里，当复制开始的时候，从库就会创建两个线程进行处理：

2.从库I/O线程:当START SLAVE语句在从库开始执行之后，从库创建一个I/O线程，该线程连接到主库并请求主库发送binlog里面的更新记录到从库上。从库I/O线程读取主库的binlog输出线程发送的更新并拷贝这些更新到本地文件，其中包括relay log文件。3.从库的SQL线程:从库创建一个SQL线程，这个线程读取从库I/O线程写到relay log的更新事件并执行。

异步复制是MySQL默认的复制方式，主库写入binlog日志后即可成功返回客户端，无须等待 binlog日志传递给从库的过程，但是一旦主库宕机，就有可能出现丢失数据的情况。