前言
在企业应用中,成熟的业务通常数据量都比较大。单台 mysql 在安全性、高可用性和高并发方面都无法满足实际的需求,实际生产环境中经常会配置多台主从数据库服务器以实现读写分离。
一、基本概念
1. 读写分离
(1) 什么是读写分离
读写分离,基本的原理是让主数据库处理事务性 增、删、改
操作(INSERT、UPDATE、DELETE),而从数据库处理 查
(SELECT) 操作。数据库复制被用来把事务性操作导致的变更同步到集群中的从数据库中。
(2) 为什么要读写分离
因为数据库的 写
(写 10000 条数据可能要 3 分钟)操作是比较耗时的。但是数据库的 读
(读 10000 条数据可能只要 5 秒钟)操作非常迅速。所以读写分离解决的是数据库的写入性能太低影响了查询的效率的问题。
(3) 什么时候要读写分离
数据库不一定要读写分离,如果程序使用数据库较多时,而更新少,查询多的情况下会考虑使用。利用数据库主从同步,再通过读写分离可以分担数据库压力,提高性能。
(4) 主从复制与读写分离
在实际的生产环境中,如果数据库的读和写都在同一个数据库服务器中,无论是在安全性、高可用性还是高并发能力等各个方面都是完全不能满足实际需求的。因此,通过主从复制的方式来同步数据,再通过读写分离来提升数据库的并发负载能力。有点类似于 rsync,但是不同的是 rsync 是对磁盘文件做备份,而 mysql 主从复制是对数据库中的数据、语句做备份。
2. MySQL 主从复制
(1) mysql 支持的复制类型
- STATEMENT:基于语句的复制。在服务器上执行 sql 语句,在从服务器上执行同样的语句,mysql 默认采用基于语句的复制,执行效率高。
- ROW:基于行的复制。把改变的内容复制过去,而不是把命令在从服务器上执行一遍。
- MIXED:混合类型的复制。默认采用基于语句的复制,一旦发现基于语句无法精确复制时,就会采用基于行的复制。
(2) 主从复制的工作过程
- Master 节点将数据的改变记录成二进制日志(bin log),当 Master 上的数据发生改变时,则将改变写入二进制日志中。
- Slave 节点会在一定时间间隔内对 Master 的二进制日志进行探测其是否发生改变,如果发生改变,则开始一个 I/O 线程请求 Master 的二进制事件。
- 同时 Master 节点为每个 I/O 线程启动一个 dump 线程,用于向其发送二进制事件,并保存至 Slave 节点的中继日志(Relay log)中,Slave 节点将启动 SQL 线程从中继日志中读取二进制日志,在本地重放,即解析成 sql 语句逐一执行,使得其数据和 Master 节点的保持一致,最后 I/O 线程和 SQL 线程将进入睡眠状态,等待下一次被唤醒。
PS:
- 中继日志通常会位于 OS 缓存中,所以中继日志的开销很小。
- 复制过程有一个很重要的限制,即复制在 Slave 上是串行化的,也就是说 Master 上的并行更新操作不能在 Slave 上并行操作。
(3) mysql 主从复制高延迟的原因
- master 服务器高并发,形成大量事务
- 网络延迟
- 主从硬件设备导致(cpu 主频、内存 io、硬盘 io)
- 本来就不是同步复制、而是异步复制
(4) mysql 主从复制高延迟的解决办法
- 从库优化 Mysql 参数。比如增大 innodb_buffer_pool_size,让更多操作在 mysql 内存中完成,减少磁盘操作
- 从库使用高性能主机(高性能 cpu、大内存),避免使用虚拟云主机,使用物理主机,提升 I/O 吞吐量
- 从库使用 SSD 磁盘
- 网络优化,避免跨机房实现同步
3. 常见的 MySQL 读写分离方式
(1) 基于程序代码内部实现
在代码中根据 select、insert 进行路由分类,这类方法也是目前生产环境应用最广泛的。优点是性能较好,因为在程序代码中实现,不需要增加额外的硬件设备开支。缺点是需要开发人员来实现, 运维人员无从下手。
需要注意的是,并不是所有的应用都适合在程序代码中实现读写分离,像一些大型复杂的 Java 应用,如果在程序代码中实现读写分离对代码改动就较大。
(2) 基于中间代理层实现
代理一般位于客户端和服务器之间,代理服务器接到客户端请求后通过判断后转发到后端数据库,有以下代表性代理应用程序:
- MySQL-Proxy
MySQL-Proxy 为 MySQL 开源项目,通过其自带的 lua 脚本进行 SQL 判断。
- Atlas
是由奇虎 360 的 Web 平台部基础架构团队开发维护的一个基于 MySQL 协议的数据中间层项目。它是在 mysql-proxy0.8.2 版本的基础上,对其进行了优化,增加了一些新的功能特性。360 内部使用 Atlas 运行的 mysql 业务,每天承载的读写请求数达几十亿条,支持事物以及存储过程。
- Amoeba
由陈思儒开发,作者曾就职于阿里巴巴。该程序由 Java 语言进行开发,阿里巴巴将其用于生产环境。但是它不支持事务和存储过程。由于使用 MySQL-Proxy 需要写大量的 Lua 脚本,这些 Lua 并不是现成的,而是需要自己去写。这对于并不熟悉 MySQL-Proxy 内置变量和 MySQL Protocol 的人来说是非常困难的。Amoeba 是一个非常容易便用、可移植性非常强的软件。因此它在生产环境中被广泛应用于数据库的代理层。
二、MySQL 主从复制架构搭建
1. 服务器配置
服务器 | 主机名 | IP | 应用 |
---|---|---|---|
Master 服务器 | master | 192.168.10.20 | mysql5.7 |
Slave1 服务器 | slave1 | 192.168.10.30 | mysql5.7 |
Slave2 服务器 | slave2 | 192.168.10.40 | mysql5.7 |
Amoeba 服务器 | amoeba | 192.168.10.50 | jdk1.6、Amoeba |
客户端 服务器 | client | 192.168.10.90 | mysql |
2. 实验前准备
所有主机关闭防火墙和 SELINUX
systemctl stop firewalld && systemctl disable firewalld
setenforce 0
12
3. mysql 主从服务器时间同步
master 服务器(192.168.10.20)
yum -y install ntp
vim /etc/ntp.conf
#--末尾添加--
server 127.127.10.0 #设置本地是时钟源,注意修改自己的网段
fudge 127.127.10.0 stratum 8 #设置时间层级为 8(限制在 15 内)
service ntpd start
12345678
slave1 服务器(192.168.10.30)
yum -y install ntp ntpdate
service ntpd start
/usr/sbin/ntpdate 192.168.10.20 #进行时间同步
crontab -e
*/30 * * * * /usr/sbin/ntpdate 192.168.10.20
1234567
slave2 服务器(192.168.10.40)
yum -y install ntp ntpdate
service ntpd start
/usr/sbin/ntpdate 192.168.10.20
crontab -e
*/30 * * * * /usr/sbin/ntpdate 192.168.10.20
1234567
4. 主服务器的 mysql 配置
vim /etc/my.cnf
#添加如下配置
server-id = 1 #定义 server-id,每台主机不可相同
log-bin=master-bin #主服务器开启二进制日志
binlog_format = MIXED #本次使用 MIXED 模式
log-slave-updates=true #允许从服务器更新二进制日志
systemctl restart mysqld
mysql -uroot -p123456
#设置从服务器账号并授权
mysql> GRANT REPLICATION SLAVE ON *.* TO 'myslave'@'192.168.10.%' IDENTIFIED BY '123456';
mysql> FLUSH PRIVILEGES;
mysql> use mysql;
mysql> select user,host,authentication_string from user;
mysql> show master status;
+-------------------+----------+--------------+------------------+-------------------+
| File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set |
+-------------------+----------+--------------+------------------+-----------------