文章目录
一、MySQL 主从复制
1.1 主从复制原理有以及架构
- 基于语句的复制(Statement,MySQL默认类型)
- 基于 行的复制(ROW)
- 混合类型的复制(MIXED)
1.1.1 服务性能扩展方式
- 向上扩展,垂直扩展
- 向外扩展,横向扩展
1.2 MySQL 扩展
- 读写分离
- 复制:每个节点都有相同的数据集,向外扩展,基于二进制日志的单项复制。
1.2.1 读写分离是什么?(读写分离基本原理)
读写分离,基本原理:让主数据库处理事务性增、改、删操作(INSERT、UPDATE、DELETE),而从数据库处理SELECT查询操作。数据库复制被用来把事务性操作导致的变更同步到集群中的从数据库。
每个事务更新数据完成之前,master 在二进制文件记录这些数据。写入二进制日志完成后,master 通知存储引擎提交事务。
1.2.1.1 三个线程,两个日志
两个日志:Binary log(二进制日志);relay log(中继日志)
三个线程:主服务器中的 dump 线程;从服务器中的 I/O 线程,SQL 线程。
简单理解,通俗易懂的:
Binary log:二进制日志;relay log:中继日志
主服务器会把数据写进二进制文件里面—》
然后从服务器的i/o线程向dump发出同步请求,dump把数据发送给i/o线程,然后i/o写入到本地的中继日志—》
然后通过mysql从服务器的sql线程来读取中继日志,实现重放
的功能,同步到自己的数据库中
最终实现mysql主从复制同步
- Dump thread:是一个监听的线程(要么是等待线程,要么是睡眠线程)
- Dump线程平常是不工作的,只有在 I/O 线程监听到有新的数据写入时,需要通过dump线程来进行相应,响应请求并传输数据。
- 比如
1.2.2 为何需要读写分离?
- 因为数据库的“写”(写10000条数据可能要3分钟)操作是比较耗时的。
- 但是数据库的“读”(读10000条数据可能只要5秒钟)。
- 所以读写分离,解决的是,数据库的写入,影响了查询的效率。
1.2.3 何时需要读写分离?
数据库不一定要读写分离,如果程序使用数据库较多时,而更新少,查询多的情况下会考虑使用。利用数据库主从同步,再通过读写分离可以分担数据库压力,提高性能。
1.2.4 主从复制;读写分离
-
在实际的生产环境中,对数据库的读和写都在同一个数据库服务器中,是不能满足实际需求的。无论是在安全性、高可用性还是高并发等各个方面都是完全不能满足实际需求的。因此,通过主从复制的方式来同步数据,再通过读写分离来提升数据库的并发负载能力。
有点类似于rsync,但是不同的是rsync是对磁盘文件做备份,而mysql主从复制是对数据库中的数据、语句做备份。 -
读写分离就是只在主服务器上写,只在从服务器上读。基本的原理是让主数据库处理事务性操作,而从数据库处理 select 查询。数据库复制被用来把主数据库上事务性操作导致的变更同步到集群中的从数据库。
1.2.5 MySQL 的四种同步方式
- 异步同步(asynchronous)
搭建简单,使用非常广泛,从mysql诞生之初,就产生了这种架构,性能非常好,可为非常成熟。但是这种架构数据是异步的,所以有丢书数据库的风险。
主服务器不需要等待从服务器是否把二进制文件拷入到中继日志中,就开始读取新的请求了。
- 同步复制(sync replication)
同步复制提供最佳安全性,保证数据安全。不丢失数据,损失性能。
主服务器需要等待从服务器把二进制文件拷贝到中继日志中,并且还要从库中执行完成,主服务器才能开始读取新的请求了。
- 半同步复制(Semi synchronous)
性能、功能都介于异步和全同步之间。从 MySQL 5.5版本开始诞生,目的是为了折中,上面两种架构性能已优缺点。
主服务器需要等待从服务器是否把二进制文件拷入到中继日志中,不管你是否在从库中执行完成,就开始读取新的请求了。
- 无损复制,增强版的半同步复制(lossless replication)
数据零丢失,性能好,mysql 5.7 诞生。
1.2.6 使用场景
- 在企业应用中,成熟的业务通常数据量都比较大。
- 单台的 MySQL 在安全性、高可用性和高并发方面都无法满足实际的需求。
- 配置多台主从数据库服务器以实现读写分离。
1.2.7 MySQL 支持的复制类型
- STATEMENT:基于语句的复制
- 在服务器上面执行 sql 语句,在从服务器上执行同样的语句, MySQL 默认采用基于语句的复制。
- ROW:基于行的复制
- 把改变的内容复制过去,而不是把命令在从服务器上执行一遍。
- MIXED:混合类型的复制
- 默认采用既有语句的复制,一旦发现基于语句无法精确复制时,就会采用基于行复制。
1.2.8 较为常见的 MySQL 读写分离
-
基于程序代码内部实现
在代码中根据 select、insert进行路由分类,这类方法也是目前生产环境应用最广泛的。
优点:性能较好,在程序代码中实现,不需要增加额外的设备为硬件开支;
缺点:需要开发人员来实现,运维人员无从下手。
但是并不是所有的应用都适合在程序代码中实现读写分离,像一些大型复杂的 Java 应用,如果在程序代码中实现读写分离对代码改动就较大。 -
基于中间代理层实现
代理一般位于客户端和服务器之间,代理服务器接到客户端请求后通过判断后转发到后端数据库的代表性程序。
-
MySQL-Proxy。MySQL-Proxy 为 MySQL 开源项目,通过其自带的 lua 脚本进行 SQL 判断。
-
Atlas 是由奇虎 360 的 Web 平台部基础架构团队开发维护的一个基于 MySQL 协议的数据中间层项目。它是在 mysql-proxy 0.8.2 版本的基础上,对其进行了优化,增加了一些新的功能特性。360 内部使用 Atlas 运行的 mysql 业务,每天承载的读写请求数达几十亿条。支持事物以及存储过程。
-
Amoeba 由陈思儒开发,作者曾就职于阿里巴巴。该程序由 Java 语言进行开发,阿里巴巴将其用于生产环境。但是它不支持事务和存储过程。
-
由于使用 MySQL Proxy 需要写大量的 Lua 脚本,这些 Lua 并不是现成的,而是需要自己去写。这对于并不熟悉 MySQL Proxy 内置变量和 MySQL Protocol 的人来说是非常困难的。
Amoeba 是一个非常容易使用、可移植性非常强的软件。因此它在生产环境中被广泛应用于数据库的代理层。
1.2.9 MySQL 主从复制与读写分离原理
客户端发送读写操作到 Amoeba 服务器,Amoeba 服务器将写的操作发送到主服务器,主服务器将写的操作记录到二进制日志中,从服务器有两个线程,一个 I/O 线程一个 SQL 线程,从服务器的 I/O 线程会在 Master 上打开一个普通的连接,Binlog dump 线程会从 Master 的二进制日志中读取事件,I/O 线程将这些事件写入中继日志,中继日志运行在缓存中,SQL 线程读取中继日志中的事件,并在自己的数据库中进行重放,Amoeba 对两个从服务器进行读操作,读取从服务器同步的事件。
二、主从复制工作过程
(1)在每个事务更新数据完成之前,Master在二进制日志(Binary log)记录这些改变。写入二进制日志完成后,Master通知存储引擎提交事务。
(2)Slave将Master的复制到其中继日志(Relay log)。首先slave开始一个工作线程(I/O),I/O线程在Master上打开一个普通的连接,然开始Binlog dump process。Binlog dump process从Master的二进制日志中读取事件,如果以及跟上Master,它会睡眠并等待Master产生新的事件,I/O线程将这些事件写入中继日志。
(3)SQL slave thread(SQL从线程)处理该线程的最后一步,SQL线程从中继日志中读取事件,并重放其中的事件而更新slave数据,使其与master的数据保持一致,只要该线程与I/O线程保持一致,中继日志通常会位于OS缓存中,所以中继日志的开销很小。
复制过程有一个和重要的限制,即复制在Slave上是串行化的,也就是说Master上的并行更新操作不能在Slave上并行操作。
PS:
- 中继日志通常会位于 OS 缓存中,所以中继日志的开销很小。
- 复制过程有一个很重要的限制,即复制在 Slave 上是串行化的,也就是说 Master 上的并行更新操作不能在 Slave 上并行操作。
出现高并发时,发生 I/O 阻塞时,一般会如何处理?
在服务器中加上一个 slave 中继,用来分担主服务器的压力,写入数据时数据量如果过大的话,有可能会造成阻塞,此时通过 slave 中继来分担,它是用来解决高并发情况下,解决 I/O 阻塞的问题。
2.1 Mysql 主从复制部署
Master:192.168.10.13
Slave1:192.168.10.14
Slave2:192.168.10.15
关闭防火墙
systemctl stop firewalld
systemctl diable firewalld
setenforce 0
2.1.1 Mysql的主从服务器时间同步
2.1.1.1 Master配置(192.168.10.13)
yum install -y ntp
vim /etc/ntp.conf
末尾添加
server 127.127.10.0 ——设置本地是时钟源127.127 ,注意修改网段 10网段
fudge 127.127.10.0 stratum 8 ——设置时间层级为8(限制在15内)
server 127.127.10.0
fudge 127.127.10.0 stratum 8
service ntpd start
2.1.1.2 Slave 1(192.168.10.14)
yum install ntp ntpdeta -y
service ntpd start
/usr/sbin/ntpdate 192.168.10.13 ——进行时间同步
crontab -e
*/30 * * * * /usr/sbin/ntpdate 192.168.10.13
Slave 2 (192.168.10.15)
yum install ntp ntpdeta -y
service ntpd start
/usr/sbin/ntpdate 192.168.10.13 ——进行时间同步
crontab -e
*/30 * * * * /usr/sbin/ntpdate 192.168.10.13
2.1.1.3 Master 的 Mysql 配置(192.168.10.13)
vim /etc/my.cnf
server-id = 1
log-bin=master-bin ——添加,主服务器开启二进制日志
binlog_format = MIXED
log-slave-updates=true ——添加,允许slave从master复制数据时可以写入到自己的二进制日志
systemctl restart mysqld
mysql -u root -pabc123
GRANT REPLICATION SLAVE ON *.* TO 'myslvae'@'192.168.10.%' IDENTIFIED BY '123456'; ——给从服务器授权
FLUSH PRIVILEGES; ——刷新权限
show master status;
重启mysql服务重启不了,并且没有报错,该如何解决?
2.1.1.4 Slave 的 Mysql 配置
vim /etc/my.cnf
server-id = 2 ——修改,注意id与Master的不同,两个Slave的id也要不同
relay-log=relay-log-bin ——添加,开启中继日志,从主服务器上同步日志文件记录到本地
relay-log-index=slave-relya-bin.index ——添加,定义中继日志文件的位置和名称,一般和relay-log在同一目录
relay_log_recovery = 1 ——选配项
当 slave 从库宕机后,假如 relay-log 损坏了,导致一部分中继日志没有处理,则自动放弃所有未执行的 relay-log,并且重新从 master 上获取日志,这样就保证了relay-log 的完整性。默认情况下该功能是关闭的,将 relay_log_recovery 的值设置为 1 时, 可在 slave 从库上开启该功能,建议开启。
systemctl restart mysqld
mysql -u root -p123456
CHANGE master to master_host='192.168.10.13',master_user='myslave',master_password='123456',master_log_file='master-bin.000001',master_log_pos=603; ——配置同步,注意 master_log_file 和 master_log_pos 的值要与Master查询的一致
start slave; ——启动同步,如有报错执行 reset slave;
show slave status\G ——查看 Slave 状态
//确保 IO 和 SQL 线程都是 Yes,代表同步正常。
Slave_IO_Running: Yes ——负责与主机的io通信
Slave_SQL_Running: Yes ——负责自己的slave mysql进程