目录
1.2 从服务器设置 (192.168.170.113)(192.168.170.114)
一、Mysql主从复制的原理
1、mysql的复制类型
①基于SQL语句的复制(默认是statement默认)
②基于行的复制(ROW)
③混合类型的复制(MIXED)
2、MySQL主从复制的工作原理
①主服务器master记录数据库通过dump线程将操作记录到binary log中。
②从服务器开启I/O线程向主服务器发送同步日志请求
③主服务器把二进制日志内容发送给从服务器
④从服务器将二进制日志记录的操作同步到relay log(中继日志)(存在从服务器的缓存中)
⑤从服务器中的sql线程将relay日志记录的操作在从服务器执行写入从服务器数据库。
3、主从复制的过程
①首先client端(tomcat)将数据写入到master节点的数据库中,master节点会通知存储引擎提交事务,同时会将数据以混合的方式保存在二进制日志中。
②slave节点会开启I/O线程,用于监听master二进制日志的更新,一旦发生更新内容,则向master中的dump线程发出同步请求。
③master的dump线程在接收到slave的I/O请求后,会读取二进制文件中更新的数据,并发送给slave的I/O线程
④slave的I/O线程收到收据后,会保存在slave节点的中继日志中。
⑤同时,slave节点中的sql线程,会读取中继日志中的数据,更新在本地mysql数据库中。
⑥最终,完成slave——>复制master数据,达到主从同步的效果。
二、MySQL读写分离的原理
读写分离的原理是让主数据库处理事务的增删改等操作,而从数据库处理select的查询操作。数据库复制被用来把事务性操作导致的变更同步到集群中的从数据库。
1、读写分离的存在意义
①数据库的写是比较耗费时间的,例如:写入100000000条数据可能需要3分钟。
②而数据库读1000000000条数据有可能只需要3秒
③所以读写分离,解决的是数据库的写入的速度,赖增加查询的效率。
2、常见的MySQL的读写分离
2.1 基于程序代码的内部实现
①在代码中根据 select、insert 进行路由分类,这类方法也是目前生产环境应用最广泛的。
②优点是性能较好,因为在程序代码中实现,不需要增加额外的设备为硬件开支;缺点是需要开发人员来实现,运维人员无从下手。
③但是并不是所有的应用都适合在程序代码中实现读写分离,像一些大型复杂的Java应用,如果在程序代码中实现读写分离对代码改动就较大。
2.2 基于中间代理层实现
①代理一般位于客户端和服务器之间,代理服务器接到客户端请求后通过判断后转发到后端数据库,有以下代表性程序:MySQL-Proxy。MySQL-Proxy 为 MySQL 开源项目,通过其自带的 lua 脚本进行SQL 判断。
②Atlas。是由奇虎360的Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。它是在mysql-proxy 0.8.2版本的基础上,对其进行了优化,增加了一些新的功能特性。360内部使用Atlas运行的mysql业务,每天承载的读写请求数达几十亿条。支持事物以及存储过程。
2.3 Amoeba
①读取请求发送给从服务器是,采用轮询调度算法
②amoeba使用的是java语言编写,配置文件是xml
③amoeba主要负责对外的一个代理IP
④访问这个IP时,发送的请求为‘写’的请求,则会传给主服务器
⑤当发送的请求为读的时候,会通过调度转发给从服务器,使用轮询算法,轮流分配给两台从服务器。
⑥amoeba可以视为调度器,如果主服务器挂掉(就是单点故障),则会由mha解决这个问题。
而且由于使用mysql proxy 需要大量的lua脚本,lua脚本时需要自己编写的,对于不熟悉mysql proxy内置变量和mysql protocol的人来说是非常困难的。amoeba是一个非常容易使用,可移植性非常强的软件,因此它在生产环境中被广泛用于数据库的代理层。
3、MySQL读写分离原理
①读写分离就是只在主服务器上写,只在从服务器上读。
②基本的原理是让主数据库处理事务性查询,而从数据库处理select查询
③数据库复制被用来把主数据库上事务性查询导致的变更同步到集群中的从数据库。
数据库不一定要读写分离,如果程序使用数据库较多时,而更新较少,查询多的情况下会考虑使用。利用数据库主从同步,再通过读写分离可以分担数据库压力,提高性能。
三、MySQL四种同步方式
1、异步复制
默认的同步方式是异步复制。主数据库写入binlog日志文件后,不需要等待数据更新是否已经复制到从库中,就可以继续处理更多的请求。master将时间写入binlog,但并不知道slave是否或何时已经接收且已经处理。在异步复制的机制的情况下,如果master宕机,事务在master上已经提交,但很可能这些事务没有传到任何的slave上。假设有master传到slave故障转移的机制,此时slave也可能会丢失事务。mysql复制默认是异步复制,异步复制提供了最佳性能。
2、同步复制
主库将更新写入binlog日志文件后,需要等待数据更新已经复制到从库中,并且已经在从库执行成功,然后才能返回继续处理其他的请求。同步复制提供了最佳安全性,保证数据安全,数据不会丢失,但对性能有一定的影响。
3、半同步复制
主库提交更新写入二进制日志文件后,等待数据更新写入了从服务器中继日志中,然后才能再继续处理其它请求。该功能确保至少有1个从库接收完主库传递过来的binlog内容已经写入到自己的relay log里面了,才会通知主库上面的等待线程,该操作完毕。
半同步复制,是最佳安全性与最佳性能之间的一个折中。
MySQL 5.5版本之后引入了半同步复制功能,主从服务器必须安装半同步复制插件,才能开启该复制功能。如果等待超时,超过rpl_semi_sync_master_timeout参数设置时间(默认值为10000,表示10秒),则关闭半同步复制,并自动转换为异步复制模式。当master dump线程发送完一个事务的所有事件之后,如果在rpl_semi_sync_master_timeout内,收到了从库的响应,则主从又重新恢复为增强半同步复制。
ACK (Acknowledge character)即是确认字符。
4、增强半同步复制
主库提交更新写入二进制日志文件后,等待数据更新写入了从服务器中继日志中,然后才能再继续处理其它请求。该功能确保至少有1个从库接收完主库传递过来的binlog内容已经写入到自己的relay log里面了,才会通知主库上面的等待线程,该操作完毕。
半同步复制,是最佳安全性与最佳性能之间的一个折中。
MySQL 5.5版本之后引入了半同步复制功能,主从服务器必须安装半同步复制插件,才能开启该复制功能。如果等待超时,超过rpl_semi_sync_master_timeout参数设置时间(默认值为10000,表示10秒),则关闭半同步复制,并自动转换为异步复制模式。当master dump线程发送完一个事务的所有事件之后,如果在rpl_semi_sync_master_timeout内,收到了从库的响应,则主从又重新恢复为增强半同步复制。
ACK (Acknowledge character)即是确认字符。
四、MySQL主从复制和读写分离实验部署
1、实验案例拓扑图
2、实验的流程
①客户端访问代理服务器
②代理服务器写入到主服务器
③主服务器将增删改写入到自己的二进制日志
④从服务器将主服务器的二进制日志同步到自己的中继日志中
⑤从服务器将中继日志的内容写入到数据库中
⑥客户端读取,则代理服务器直接访问从服务器
⑦降低负载,起到负载均衡的作用
3、配置
主机 | 操作系统 | IP地址 | 所需工具/软件/安装包 |
Master | CentOS7 | 192.168.170.111 | ntp 、 mysql-boost-5.7.20.tar.gz |
Slave1 | CentOS7 | 192.168.170.113 | ntp 、ntpdate 、mysql-boost-5.7.20.tar.gz |
Slave2 | CentOS7 | 192.168.170.114 | ntp 、ntpdate 、 mysql-boost-5.7.20.tar.gz |
Amoeba | CentOS7 | 192.168.170.115 | jdk-6u14-linux-x64.bin、amoeba-mysql-binary-2.2.0.tar.gz |
客户端 | CentOS7 | 192.168.170.116 | ———————— |
开始之前统一关闭防火墙以及核心防护
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
五、搭建MySQL主从复制
1、mysql主从服务器时间同步
1.1 主服务器:192.168.170.111
yum -y install ntp
vim /etc/ntp.conf
进入ntp配置文件在末行添加以下字段
server 127.127.170.0 #设置本地是时钟源,注意修改网段
fudge 127.127.170.0 stratum 8 #设置时间层级为8(限制在15内)
systemctl start ntpd
1.2 从服务器设置 (192.168.170.113)(192.168.170.114)
yum -y install ntp ntpdate
service ntpd start
/usr/sbin/ntpdate 192.168.170.111 #进行时间同步,指向Master服务器IP
crontab -e
*/30 * * * * /usr/sbin/ntpdate 192.168.170.111
2、主服务器的mysql配置
vim /etc/my.cnf
server-id = 1
log-bin=master-bin #添加,主服务器开启二进制日志
log-slave-updates=true #添加,允许从服务器更新二进制日志
binlog_format = MIXED
systemctl restart mysqld
mysql -u root -p
GRANT REPLICATION SLAVE ON *.* TO 'myslave'@'192.168.170.%' IDENTIFIED BY '123456';
#给从服务器授权
FLUSH PRIVILEGES;
show master status;
#File 列显示日志名,Fosition 列显示偏移量
3、从服务器的mysql配置
vim /etc/my.cnf
server-id = 2 #修改,注意id与Master的不同,两个Slave的id也要不同
relay-log=relay-log-bin #添加,开启中继日志,从主服务器上同步日志文件记录到本地
relay-log-index=slave-relay-bin.index #添加,定义中继日志文件的位置和名称
relay_log_recovery = 1 #选配项
#当 slave 从库宕机后,假如 relay-log 损坏了,导致一部分中继日志没有处理,则自动放弃所有未执行的 relay-log,并且重新从 master 上获取日志,这样就保证了relay-log 的完整性。默认情况下该功能是关闭的,将 relay_log_recovery 的值设置为 1 时, 可在 slave 从库上开启该功能,建议开启。
systemctl restart mysqld
mysql -u root -p
change master to master_host='192.168.170.111' , master_user='myslave',master_password='123456',master_log_file='master-bin.000001',master_log_pos=604;
#配置同步,注意 master_log_file 和 master_log_pos 的值要与Master查询的一致,这里的是例子,每个人的都不一样
start slave; #启动同步,如有报错执行 reset slave;
show slave status\G #查看 Slave 状态
//确保 IO 和 SQL 线程都是 Yes,代表同步正常。
Slave_IO_Running: Yes #负责与主机的io通信
Slave_SQL_Running: Yes #负责自己的slave mysql进程
192.168.170.114从服务器2配置
除了server-id改成3,其余配置与从服务器一致
4、验证主从复制效果
主服务器上进行执行 create database kfc;
去从服务器上查看show databases;
六、搭建MySQL读写分离
1、安装java环境
因为 Amoeba 基于是 jdk1.5 开发的,所以官方推荐使用 jdk1.5 或 1.6 版本,高版本不建议使用。
将jdk-6u14-linux-x64.bin 和 amoeba-mysql-binary-2.2.0.tar.gz.0 上传到/opt目录下。
cd /opt/
cp jdk-6u14-linux-x64.bin /usr/local/
cd /usr/local/
chmod +x jdk-6u14-linux-x64.bin
./jdk-6u14-linux-x64.bin
按空格到最后一行
按yes,按enter
mv jdk1.6.0_14/ /usr/local/jdk1.6
vim /etc/profile
export JAVA_HOME=/usr/local/jdk1.6
export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export PATH=$JAVA_HOME/lib:$JAVA_HOME/jre/bin/:$PATH:$HOME/bin
export AMOEBA_HOME=/usr/local/amoeba
export PATH=$PATH:$AMOEBA_HOME/bin
source /etc/profile
java -version
##安装 Amoeba软件##
mkdir /usr/local/amoeba
tar zxvf /opt/amoeba-mysql-binary-2.2.0.tar.gz -C /usr/local/amoeba/
chmod -R 755 /usr/local/amoeba/
/usr/local/amoeba/bin/amoeba
//如显示amoeba start|stop 说明安装成功
amoeba(192.168.170.115)
2、配置amoeba读写分离,两个slave读负载均衡
现在master,slave1,slave2的mysql上开放权限给amoabe访问
grant all on *.* to test@'192.168.170.%' identified by '123123';
然后amoeba服务器配置amoeba服务
cd /usr/local/amoeba/conf/
cp amoeba.xml amoeba.xml.bak
vim amoeba.xml #修改amoeba配置文件
30修改
<property name="user">amoeba</property>
32修改
<property name="password">123123</property>
115修改
<property name="defaultPool">master</property>
117去掉注释–
<property name="writePool">master</property>
<property name="readPool">slaves</property>
然后修改数据库的配置文件
cp dbServers.xml dbServers.xml.bak
vim dbServers.xml #修改数据库配置文件
23注释掉
作用:默认进入test库 以防mysql中没有test库时,会报错
<!-- mysql schema
<property name="schema">test</property>
-->
26修改
<!-- mysql user -->
<property name="user">test</property>
28-30去掉注释
<property name="password">123123</property>
45修改,设置主服务器的名Master
<dbServer name="master" parent="abstractServer">
48修改,设置主服务器的地址
<property name="ipAddress">192.168.170.113</property>
52修改,设置从服务器的名slave1
<dbServer name="slave1" parent="abstractServer">
55修改,设置从服务器1的地址
<property name="ipAddress">192.168.170.114</property>
58复制上面6行粘贴,设置从服务器2的名slave2和地址
<dbServer name="slave2" parent="abstractServer">
<property name="ipAddress">192.168.223.11</property>
65修改
<dbServer name="slaves" virtual="true">
71修改
<property name="poolNames">slave1,slave2</property>
/usr/local/amoeba/bin/amoeba start& #启动Amoeba软件,按ctrl+c 返回
netstat -anpt | grep java #查看8066端口是否开启,默认端口为TCP 8066
3、测试读写分离
在客户端服务器上进行测试:
使用yum快速安装mysql虚拟客户端
yum install -y mariadb mariadb-server
mysql -u amoeba -p123123 -h 192.168.170.115 -P8066
通过amoeba服务器代理访问mysql ,在通过客户端连接mysql后写入的数据只有主服务会记录,然后同步给从服务器
4、主服务器上
create database njzb;
use njzb;
create table test (id int(10),name varchar(10),address varchar(20));
两台slave上
stop slave; #关闭同步
use njzb;
在slave1上
insert into test values('1','zsp','this_is_slave1');
在slave2上
insert into test values('2','rmh'','this_is_slave2');
在主服务器上
insert into test values('3','wsk','this_is_master');
在客户端服务器上
use njzb;
select * from test; //客户端会分别向slave1和slave2读取数据,显示的只有在两个从服务器上添加的数据,没有在主服务器上添加的数据
insert into test values('4','cph','this_is_client'); //只有主服务器上有此数据
在master上
slave1
slave2
然后再从两个slave上执行start slave;即可实现同步在主服务器和客户机上添加的数据
七、数据库主从延迟的原因与解决方案
1、什么叫主从延迟?
①主库执行完成一个事务,写入binlog,把这个时间叫做time1
②主库同步数据给库,从库接受完这个binlog的时间,记录为time2
③从库执行完这个事务,这个时刻记录为time3
主从延迟,就是指同一个事务,在从库执行完成的时间和在主库执行完的时间插值就是time3-time1
2、哪些情况会导致主从延迟?
①如果从库所在的机器比主库的机器性能差,会导致主从延迟,这种情况比较好解决,只需选择主从库一样规格的机器就好。
②如果从库的压力大,也会导致主从延迟。比如主库直接影响业务,大家可能使用会比较克制,因此一般查询都打到从库了,结果导致从库查询消耗大量CPU,影响同步速度,最后导致主从延迟。这种情况的话,可以搞一主多从架构,即多接几个从库分摊读的压力。另外,还可以把binlog接入到Hadoop这类系统,让它们提供查询的能力。
③大事务也会导致主从延迟。如果一个事务执行就要10分钟,那么主库执行完后,给到从库执行,最后这个事务可能就会导致从库延迟10分钟啦。日常开发中,我们为什么特别强调,不要一次性delete太多SQL,需要分批进行,其实也是为了避免大事务。另外,大表的DDL语句,也会导致大事务,大家日常开发关注一下哈。
④网络延迟也会导致主从延迟,这种情况你只能优化你的网络啦,比如带宽20M升级到100M类似意思等。
⑤如果从数据库过多也会导致主从延迟,因此要避免复制的从节点数量过多。从库数据一般以3-5个为宜。
⑥低版本的MySQL只支持单线程复制,如果主库并发高,来不及传送到从库,就会导致延迟。可以换用更高版本的Mysql,可以支持多线程复制。
3、同步失败的话可以解决的方法
①忽略当前操作失误执行下一步的同步
先stop slave;
然后再slave数据库中:set global sql_slave_skip_counter=1;
start slave;
首先遇到这个是因为binlog位置索引处的问题,生产环境下不要直接reset slave(删除change master 操作的);
reset slave会将主从同步的文件以及位置恢复到初始状态,一开始没有数据还好,有数据的话,相当于重新开始同步,可能会出现一些问题;
一般做主从同步,都是要求以后的数据实现主从同步,而对于旧的数据完全可以使用数据库同步工具先将数据库同步,完了再进行主从同步;
4、针对3的问题正确的解决方法是:
①打开主(master)服务器,进入mysql
②执行flush logs;//这时主服务器会重新创建一个binlog文件;
③在主服务上执行show master status\G;显示如下:
④来到从服务器的mysql;
⑤stop slave;
⑥change master to master_log_file='mysql-bin.000012',master_log_pos=154;//这里的file和pos都是上面主服务器master显示的。
⑦start slave; //这时候就应可以了
八、总结
1、主从复制原理
①首先client端(tomcat)将数据写入到master节点的数据库中,master节点会通知存储引擎提交事务,同时会将数据以(基于行、基于sql、基于混合)的方式保存在二进制日志中
②SLAVE节点会开启I/O线程,用于监听master的二进制日志的更新,一旦发生更新内容,则向master的dump线程发出同步请求
③master的dump线程在接收到SLAVE的I/O请求后,会读取二进制文件中更新的数据,并发送给SLAVE的I/O线程
④SLAVE的I/O线程接收到数据后,会保存在SLAVE节点的中继日志中
⑤同时,SLAVE节点钟的SQL线程,会读取中继日志钟的熟,更新在本地的mysql数据库中
⑥最终,完成slave——>复制master数据,达到主从同步的效果
2、如何查看主从同步状态是否成功
在从服务器内输入命令 show slave status\G,查看主从信息进行查看,里面有IO线程的状态信息,还有master服务器的IP地址、端口、事务开始号,
当 slave_io_running 和 slave_sql_running 都显示为yes时,表示主从同步状态成功
3、如果i/o和sql不是yes呢,如何排查
①首先排除网络问题,使用ping命令查看从服务是否能与主服务器通信
②再者查看防火墙和核心防护是否关闭
③接着查看从服务器内的slave是否开启
④两个从服务器的 server-id 是否相同导致只能连上一台
⑤master_log_file 和 master_log_pos 的值要是否与Master查询的一致
4、show slave status能看到哪些信息
IO线程的状态信息
master服务器的IP地址、端口、事务开始位置
最近一次的报错信息和报错位置等
5、主从复制慢(延迟)有哪些可能
主服务器的负载过大,被多个睡眠或者僵尸线程占用,导致系统负载过大
从库硬件比主库差,导致复制延迟
主从复制单线程,如果主库写并发太大,来不及传送到从库,就会导致延迟。
慢SQL语句过多
网络延迟