前言
在实际的生产环境中,对数据库的读和写都在同一个数据库服务器中,是不能满足实际需求的。无论是在安全性、高可用性还是高并发等各个方面都是完全不能满足实际需求的。因此,通过主从复制的方式来同步数据,再通过读写分离来提升数据库的并发负载能力。有点类似于rsync,但是不同的是rsync是对磁盘文件做备份,而mysql主从复制是对数据库中的数据、语句做备份。
一、MySQL 主从复制原理
MySQL 的主从复制和 MySQL 的读写分离两者有着紧密联系,首先要部署主从复制,只有主从复制完成了,才能在此基础上进行数据的读写分离。
1、MySQL 支持的复制类型
- 基于语句的复制(STATEMENT):在主服务器上执行的 SQL 语句,在从服务器上执行同样的语句。MySQL 默认采用基于语句的复制,效率比较高。
- 基于行的复制(ROW):把改变的内容复制过去,而不是把命令在从服务器上执行一遍。
- 混合类型的复制(MIXED):默认采用基于语句的复制,一旦发现基于语句无法精确复制时,就会采用基于行的复制。
2、MySQL主从复制的工作过程
1)Master 服务器保存记录到二进制日志
在每个事务更新数据完成之前,Master 服务器在二进制日志(Binary log)记录这些改变。写入二进制日志完成后,Master 服务器通知存储引擎提交事务。
2)Slave 服务器复制 Master 服务器的日志
- Slave 服务器将 Master 服务器的二进制日志复制到其中继日志(Relay log)。
- 首先 Slave 服务器开始一个工作线程(I/O),I/O线程在 Master 服务器上打开一个普通的连接,然后开始 Binlog dump process。
- Binlog dump process 从 Master 服务器的二进制日志中读取事件,如果 Slave 服务器已经跟上 Master 服务器,它会睡眠并等待 Master 服务器产生新的事件,I/O线程将这些事件写入中继日志。
3)Slave 服务器重放复制过来的日志
SQL slave thread(SQL从线程)处理该过程的最后一步,SQL线程从中继日志读取事件,并重放其中的事件而更新 Slave 服务器的数据,使其与 Master 服务器中的数据一致,只要该线程与 I/O 线程保持一致,中继日志通常会位于 OS 缓存中,所以中继日志的开销很小。
二、MySQL读写分离
1、读写分离的概念
读写分离基本的原理是让主数据库处理事务性增、改、删操作(INSERT、UPDATE、DELETE),而从数据库处理SELECT查询操作。数据库复制被用来把事务性操作导致的变更同步到集群中的从数据库。
2、读写分离存在意义
因为数据库的“写”(写10000条数据可能要3分钟)操作是比较耗时的。
但是数据库的“读”(读10000条数据可能只要5秒钟)。
所以读写分离,解决的是,数据库的写入,影响了查询的效率
3、什么时候要读写分离
数据库不一定要读写分离,如果程序使用数据库较多时,而更新少,查询多的情况下会考虑使用。利用数据库主从同步,再通过读写分离可以分担数据库压力,提高性能。
4、MySQL 读写分离原理
读写分离就是只在主服务器上写,只在从服务器上读。
基本的原理是让主数据库处理事务性查询,而从数据库处理 select 查询。
数据库复制被用来把主数据库上事务性查询导致的变更同步到集群中的从数据库。
5、常见的 MySQL 读写分离
1、MySQL 读写分离原理
只在主服务器上写,只在从服务器上读。
主数据库处理事务性查询,而从数据库处理 select 查询。
数据库复制被用来把主数据库上事务性查询导致的变更同步到集群中的从数据库。
2、读写分离方案
基于程序代码内部实现
在代码中根据select. insert 进行路由分类,这类方法也是目前生产环境应用最广泛的。优点是性能较好,因为在程序代码中实现,不需要增加额外的设备作为硬件开支:缺点是需要开发人员来实现,运维人员无从下手。
基于中间代理层实现
代理一般位于客户端和服务器之间,代理服务器接到客户端的请求后通过判断后转发到后端数据库,有两个代表性程序。
(1) MySQL-Proxy。MySQL- -Proxy为MySQL开源项目,通过其自带的lua脚本进行SQL判断,虽然是MySQL官方产品,但是MySQL官方并不建议将MySQL- -Proxy 用到生产环境。
(2) Amoeba (变形虫)。由陈思儒开发,其曾就职于阿里巴巴。该程序用Java语言进行开发,阿里巴巴将其用于生产环境。它不支持事务和存储过程。
经过上述简单的比较,通过程序代码实现MySQL读写分离自然是一个不错的选择, 但是并不是所有的应用都适合在程序代码中实现读写分离,例如一些大型复杂的Java应用,如果在程序代码中实现读写分离对代码改动就较大。所以,像这种大型复杂的应用一般会考虑使用代理层来实现。
三、MySQL主从复制和读写分离实验部署
安装mysql数据库:MySQL 安装
实验思路:
- 第一步:客户端client访问代理服务器amoeba
- 第二步:代理服务器读写判断
- 写操作:写入到主服务器
- 第三步:主服务器将增删改写入自己二进制日志
- 第四步:从服务器将主服务器的二进制日志同步至自己中继日志
- 第五步:从服务器重放中继日志到数据库中
- 读操作:直接访问从服务器
- 最终结果:降低负载,起到负载均衡作用
主机 | 操作系统 | IP地址 | 所需工具/软件/安装包 |
---|---|---|---|
Amoeba | CentOS7 | 192.168.132.10 | jdk-6u14-linux-x64.bin、amoeba-mysql-binary-2.2.0.tar.gz |
Master | CentOS7 | 192.168.132.20 | ntp 、 mysql-boost-5.7.20.tar.gz |
Slave1 | CentOS7 | 192.168.132.30 | ntp 、ntpdate 、 mysql-boost-5.7.20.tar.gz |
Slave2 | CentOS7 | 192.168.132.40 | ntp 、ntpdate 、mysql-boost-5.7.20.tar.gz |
客户端 | CentOS7 | 192.168.132.50 |
将所有主机的防火墙和安全机制关闭
1、搭建 MySQL 主从复制
1)Mysql主从服务器时间同步
Master服务器:192.168.132.20
yum -y install ntp
vim /etc/ntp.conf
##---------末尾添加---------
server 127.127.132.0 #设置本地是时钟源,注意修改网段
fudge 127.127.132.0 stratum 8 #设置时间层级为8(限制在15内)
service ntpd start
Slave1服务器:192.168.132.30
Slave2服务器:192.168.132.40
yum -y install ntp ntpdate
service ntpd start
/usr/sbin/ntpdate 192.168.132.20 #进行时间同步,指向Master服务器IP
crontab -e
*/30 * * * * /usr/sbin/ntpdate 192.168.132.20
2)主服务器的mysql配置
Master服务器:192.168.132.20
vim /etc/my.cnf
server-id = 1
log-bin=master-bin #添加,主服务器开启二进制日志
log-slave-updates=true #添加,允许从服务器更新二进制日志
systemctl restart mysqld
mysql -u root -p
#给从服务器授权
grant replication slave on *.* to 'myslave'@'192.168.132.%' identified by '123456';
flush privileges;
show master status;
#File 列显示日志名,Fosition 列显示偏移量
3)从服务器的mysql配置
Slave1服务器:192.168.132.30
Slave2服务器:192.168.132.40
vim /etc/my.cnf
#修改,注意id与Master的不同,两个Slave的id也要不同
server-id = 2
#添加,开启中继日志,从主服务器上同步日志文件记录到本地
relay-log=relay-log-bin
#添加,定义中继日志文件的位置和名称
relay-log-index=slave-relay-bin.index
systemctl restart mysqld
mysql -u root -p
#配置同步,注意 master_log_file 和 master_log_pos 的值要与Master查询的一致,
change master to master_host='192.168.132.20' , master_user='myslave',master_password='123456',master_log_file='master-bin.000001',master_log_pos=604;
start slave; #启动同步,如有报错执行 reset slave;
show slave status\G #查看 Slave 状态
//确保 IO 和 SQL 线程都是 Yes,代表同步正常。
Slave_IO_Running: Yes #负责与主机的io通信
Slave_SQL_Running: Yes #负责自己的slave mysql进程
一般 Slave_IO_Running: No 的可能性:
- 网络不通
- my.cnf配置有问题
- 密码、file文件名、pos偏移量不对
- 防火墙没有关闭
4)验证主从复制效果
四、搭建 MySQL 读写分离
1、Amoeba服务器配置
Amoeba服务器:192.168.132.10
Amoeba服务器:192.168.172.40
将jdk-6u14-linux-x64.bin 和 amoeba-mysql-binary-2.2.0.tar.gz.0 上传到/opt目录下。
cd /opt/
cp jdk-6u14-linux-x64.bin /usr/local/
cd /usr/local/
chmod +x jdk-6u14-linux-x64.bin
./jdk-6u14-linux-x64.bin
按空格到最后一行
按yes,按enter
mv jdk1.6.0_14/ /usr/local/jdk1.6
vim /etc/profile
export JAVA_HOME=/usr/local/jdk1.6
export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export PATH=$JAVA_HOME/lib:$JAVA_HOME/jre/bin/:$PATH:$HOME/bin
export AMOEBA_HOME=/usr/local/amoeba
export PATH=$PATH:$AMOEBA_HOME/bin
source /etc/profile
java -version
2、安装 Amoeba软件
mkdir /usr/local/amoeba
tar zxvf /opt/amoeba-mysql-binary-2.2.0.tar.gz -C /usr/local/amoeba/
chmod -R 755 /usr/local/amoeba/
/usr/local/amoeba/bin/amoeba
//如显示amoeba start|stop 说明安装成功
3、在主从服务器的mysql上授权
先在Master、Slave1、Slave2 的mysql上开放权限给 Amoeba 访问
grant all on *.* to test@'192.168.132.%' identified by '654321';
4、配置 Amoeba读写分离,两个 Slave 读负载均衡
amoeba服务器配置amoeba服务
(1)修改amoeba配置文件
cd /usr/local/amoeba/conf/
cp amoeba.xml amoeba.xml.bak
vim amoeba.xml #修改amoeba配置文件
#---------30修改------------------------------
<property name="user">amoeba</property>
#---------32修改------------------------------
<property name="password">35123512</property>
#---------115修改-----------------------------
<property name="defaultPool">master</property>
#---------117去掉注释–------------------------
<property name="writePool">master</property>
<property name="readPool">slaves</property>
(2)修改数据库配置文件
cp dbServers.xml dbServers.xml.bak
vim dbServers.xml
#---------23注释掉--------------------------------------
作用:默认进入test库 以防mysql中没有test库时,会报错
<!-- mysql schema
<property name="schema">test</property>
-->
#---------26修改-----------------------------------------
<!-- mysql user -->
<property name="user">test</property>
#---------28-30去掉注释----------------------------------
<property name="password">654321</property>
#---------45修改,设置主服务器的名Master------------------
<dbServer name="master" parent="abstractServer">
#---------48修改,设置主服务器的地址----------------------
<property name="ipAddress">192.168.132.20</property>
#---------52修改,设置从服务器的名slave1-----------------
<dbServer name="slave1" parent="abstractServer">
#---------55修改,设置从服务器1的地址---------------------
<property name="ipAddress">192.168.132.30</property>
#---------58复制上面6行粘贴,设置从服务器2的名slave2和地址---
<dbServer name="slave2" parent="abstractServer">
<property name="ipAddress">192.168.132.40</property>
#---------修改后的65或66修改-------------------------------------
<dbServer name="slaves" virtual="true">
#---------71修改----------------------------------------
<property name="poolNames">slave1,slave2</property>
/usr/local/amoeba/bin/amoeba start& #启动Amoeba软件,按ctrl+c 返回
netstat -anpt | grep java #查看8066端口是否开启,默认端口为TCP 8066
5、测试读写分离
客户端:192.168.132.50
使用yum快速安装MySQL虚拟客户端
yum install -y mysql mysql-server
mysql -u amoeba -p654321 -h 192.168.132.10 -P8066
测试一: amoeba服务器是否关联后端mysal
测试二:测试mysql读写分离
#2台从服务器关闭主从同步,测试amoeba读写分离
测试三:读写分离架构,对于"读”的任务是怎么操作的测试方式:
分别在slave1和salve2 ky09数据库中插入不同数据,然后使用客户端进行select查询,观测结果:
总结
mysql主从复制原理
slave节点与主节点进行连接,建立主从关系,并把从哪开始同步,及哪个日志文件都一并发送到master
master将修改的数据保存到binlog中
master开启binlog dump线程,将binlog日志推送到连接的slave中
slave接受到推送的binlog,slave开启IO线程将数据写到中继日志(relay log)中
slave同时还会开启一个SQL线程,对比中继日志中新增的内容,并且解析SQL,回放数据到从数据库中
面试题:
如何查看主从同步状态是否成功
show slave status
show master status
如果I/O和sql不是yes呢,你是如何排查的
先看last errno有几个错误 有什么错误等等都有信息显示
网络不通
my.cnf配置有问题
密码、file文件名、pos偏移量不对
防火墙没有关闭
show slave status 能看到哪些信息(比较重要的)
io状态 两个线程的yes
Last_Errno,Last_Error**
slave的SQL线程读取日志参数的的错误数量和错误消息。错误数量为0并且消息为空字符串表示没有错误;
如果Last_Error值不是空值,它也会在从属服务器的错误日志中作为消息显示。
主从复制慢(延迟)有哪些可能
从库硬件比主库差,导致复制延迟
主从复制单线程,如果主库写并发太大,来不及传送到从库,就会导致延迟。更高版本的mysql可以支持多线程复制
慢SQL语句过多
网络延迟
master负载:主库读写压力大,导致复制延迟,架构的前端要加buffer及缓存层
slave负载:一般的做法是,使用多台slave来分摊读请求,再从这些slave中取一台专用的服务器,只作为备份用,不进行其他任何操作.
mysql主从同步读写分离的三个账号
主从同步(数据库互相授权的账号)
amoeba(客户端访问amoeba)
amoeba(amoeba访问数据库集群)