主从复制
概述
主从复制是指将主数据库的 DDL 和 DML 操作通过二进制日志传到从库服务器中,然后在从库上对这些日志重新执行(也叫重做),从而使得从库和主库的数据保持同步。MySQL支持一台主库同时向多台从库进行复制, 从库同时也可以作为其他从服务器的主库,实现链状复制。
原理
MySQL主从复制的核心就是 二进制日志,具体的过程如下:
- Master 主库在事务提交时,会把数据变更记录在二进制日志文件 Binlog 中。
- 从库读取主库的二进制日志文件 Binlog ,写入到从库的中继日志 Relay Log 。
- slave重做中继日志中的事件,将改变反映它自己的数据。
搭建
准备好两台服务器之后,在上述的两台服务器中分别安装好MySQL,并完成基础的初始化准备(安装、密码配置等操作)工作。
主库配置
- 修改配置文件 /etc/my.cnf
#mysql 服务ID,保证整个集群环境中唯一,取值范围:1 – 232-1,默认为1
server-id=1
#是否只读,1 代表只读, 0 代表读写
read-only=0
#忽略的数据, 指不需要同步的数据库
#binlog-ignore-db=mysql
#指定同步的数据库
#binlog-do-db=db01 - 重启MySQL服务器
systemctl restart mysqld - 登录mysql,创建远程连接的账号,并授予主从复制权限
#创建itcast用户,并设置密码,该用户可在任意主机连接该MySQL服务
CREATE USER ‘itcast’@‘%’ IDENTIFIED WITH mysql_native_password BY ‘Root@123456’;
#为 ‘itcast’@‘%’ 用户分配主从复制权限
GRANT REPLICATION SLAVE ON . TO ‘itcast’@‘%’; - 通过指令,查看二进制日志坐标
show master status ;
字段含义说明:
file : 从哪个日志文件开始推送日志文件
position : 从哪个位置开始推送日志
binlog_ignore_db : 指定不需要同步的数据库
从库配置
- 修改配置文件 /etc/my.cnf
#mysql 服务ID,保证整个集群环境中唯一,取值范围:1 – 2^32-1,和主库不一样即可
server-id=2
#是否只读,1 代表只读, 0 代表读写
read-only=1 - 重启MySQL服务器
systemctl restart mysqld - 登录mysql,设置主库配置
CHANGE REPLICATION SOURCE TO SOURCE_HOST=‘XXX’, SOURCE_USER=‘itcast’,
SOURCE_PASSWORD=‘Root@123456’, SOURCE_LOG_FILE=‘binlog.000004’,
SOURCE_LOG_POS=663;
上述是8.0.23中的语法。如果mysql是 8.0.23 之前的版本,执行如下SQL:
CHANGE MASTER TO MASTER_HOST=‘XXX’, MASTER_USER=‘itcast’,
MASTER_PASSWORD=‘Root@123456’, MASTER_LOG_FILE=‘binlog.000004’,
MASTER_LOG_POS=663;
- 开启同步操作
start replica ; #8.0.22之后
start slave ; #8.0.22之前 - 查看主从同步状态
show replica status ; #8.0.22之后
show slave status ; #8.0.22之前
分库分表
问题分析
随着互联网及移动互联网的发展,应用系统的数据量也是成指数式增长,若采用单数据库进行数据存储,存在以下性能瓶颈:
- IO瓶颈:热点数据太多,数据库缓存不足,产生大量磁盘IO,效率较低。 请求数据太多,带宽不够,网络IO瓶颈。
- CPU瓶颈:排序、分组、连接查询、聚合统计等SQL会耗费大量的CPU资源,请求数太多,CPU出现瓶颈。
为了解决上述问题,我们需要对数据库进行分库分表处理。
分库分表的中心思想都是将数据分散存储,使得单一数据库/表的数据量变小来缓解单一数据库的性能问题,从而达到提升数据库性能的目的。
拆分策略
分库分表的形式,主要是两种:垂直拆分和水平拆分。而拆分的粒度,一般又分为分库和分表。
垂直拆分
- 垂直分库
以表为依据,根据业务将不同表拆分到不同库中。
每个库的表结构都不一样。
每个库的数据也不一样。
所有库的并集是全量数据。 - 垂直分表
以字段为依据,根据字段属性将不同字段拆分到不同表中。
每个表的结构都不一样。
每个表的数据也不一样,一般通过一列(主键/外键)关联。
所有表的并集是全量数据。
水平拆分
- 水平分库
以字段为依据,按照一定策略,将一个库的数据拆分到多个库中。
每个库的表结构都一样。
每个库的数据都不一样。
所有库的并集是全量数据。 - 水平分表
以字段为依据,按照一定策略,将一个表的数据拆分到多个表中。
每个表的表结构都一样。
每个表的数据都不一样。
所有表的并集是全量数据。
实现技术
- shardingJDBC:基于AOP原理,在应用程序中对本地执行的SQL进行拦截,解析、改写、路由处理。需要自行编码配置实现,只支持java语言,性能较高。
- MyCat:数据库分库分表中间件,不用调整代码即可实现分库分表,支持多种语言,性能不及前者。
学习内容来自黑马程序员