简介
PXC (Percona XtraDB Cluster)是一个开源的MySQL高可用解决方案。它将Percona Server和XtraBackup与Galera库集成,以实现同步多主复制。基于Galera的高可用方案主要有MariaDB Galera Cluster和Percona XtraDB Cluster,目前PXC架构在生产线上用的更多而且更成熟一些。PXC相比那些传统的基于主从模式的集群架构MHA和双主,Galera Cluster最突出的特点就是解决了诟病已久的复制延迟问题,基本上可以达到实时同步。而且节点与节点之间,它们互相的关系是对等的。本身Galera Cluster也是一种多主架构。PXC是在存储引擎层实现的同步复制,而非异步复制,所以其数据的一致性是相当高的。
要搭建PXC架构至少需要三个MySQL实例来组成一个集群,三个实例之间不是主从模式,而是各自为主,所以三者是对等关系,不分从属,这也叫multi-master架构。客户端读写时,连接哪个实例都是一样的,读取到的数据是相同的,写入任意一个实例后,集群会将自己新写入的数据同步到其它实例上,这种架构不共享任何数据,是—种高元余的集群架构。
PXC的优缺点
优点:
实现了MySQL集群的高可用性和数据的强一致性。
完成了真正的多节点读写的集群方案。
改善了主从复制延迟问题,基本上达到了实时同步。
新加入的节点可以自动部署,无需提前手动备份,维护方便。
由于是多节点写入,所以DB故障切换很容易。
缺点:
加入新节点时开销大。添加新节点时,必须从现有节点之一复制完整数据集。如果是100GB,则复制
100GB。
任何更新的事务都需要全局验证通过,才会在其它节点上执行,。集群性能受限于性能最差的节点,也就说常说的木桶定律。
因为需要保证数据的一致性,PXC采用的实时基于存储引擎层来实现同步复制,所以在多节点并发写入时,锁冲突问题比较严重。
存在写扩大的问题。所以节点上都会发生写操作,对于写负载过大的场景,不推荐使用PXC。
只支持InnoDB存储引擎
PXC的原理
PXC的操作流程大体是这样的,首先客户端向请求连接的写入节点提交事务之前,由该节点将需要产生的relication writeset广播出去,然后获取全局事务ID,一并传送到其它的节点上去。其它节点通过certification合并数据之后,发现没有冲突数据,便执行apply_cb和commit_cb操作,否则就discard此次事务。而当前节点(客户端请求的写入节点)通过验证之后,执行commit_cb操作,并返回OK给客户端。如果验证没有通过,则rollback_Cb。
在生产线上的PXC集群中,至少要有三台节点。如果其中一个节点没有验证通过,出现了数据冲突,那么此时采取的方式就是将出现数据不一致的节点踢出集群,而且它会自动执行shutdown命令来自动关机。
PXC的重要概念
首先要规范集群中节点的数星,整个集群节点数控制在最少3个、最多8个的范围内。最少3个是为了防止脑裂现象,因为只有在两个节点的情况下才会出现脑裂。脑裂的表现就是输出任何命令,返回结果都是unkown command。
当一个新节点要加入PXC集群的时候,需要从集群中各节点里选举出一个doner节点作为全量数据的贡献者。
PXC有两种节点的数据传输方式,
一种叫SST全量传输,
一种叫ST增量传输。SST传输有XtraBackup.
mysqldump、rsync三种方式,而增量传输只有XtraBackup。一般数据量不大的时候可以使用SST作为全量传输,但也只使用XtraBackup方式。节点在集群中,会因新节点的加入或故障,同步失效等而发生状态的切换,
下面列举出这些状态的含义:
open:节点启动成功,尝试连接到集群
primary:节点已在集群中,在新节点加入集群时,选取donor进行数据同步时会产生式的状态。
joiner:节点处于等待接收同步数据文件的状态。
joined:节点已完成了数据同步,尝试保持和集群中其它节点进度—致。
synced:节点正常提供服务的状态,表示已经同步完成并和集群进度保持一致。
doner:节点处于为新加入节点提供全量数据时的状态。
PXC中的重要配置参数
搭建PXC过程中,需要在my.cnf中设置以下参数:
wsrep_cluster_name:指定集群的逻辑名称,对于集群中的所有节点,集群名称必须相同。
wsrep_cluster_address:指定集群中各节点的地址
wsrep_node_name:指定当前节点在集群中的逻辑名称
wsrep_node_address:指定当前节点的IP地址
wsrep_provider:指定Galera车的路径
wsrep_sst_method;模式情况下,PXC使用XtraBackup进行SST传输。强烈建议该参数指xtrabackup-v2
wsrep_sst_auth:指定认证凭证SST作为<sst_user> <sst_pwd>。必须在引导第一个节点后创建此用户并赋予必要的权限。
pxc_strict_mode:严格模式,官方建议该参数值为ENFORCING。
在PXC中还有一个特别重要的模块就是Gcache。它的核心功能就是每个节点缓存当前最新的写集。如果有新节点加入集群,就可以把新数据等待增量传递给新节点,而不需要再使用SST方式了。这样可以让节点更快地加入集群中。
GCache模块涉及了如下参数:
gcache.size代表用来缓存写集增量信息的大小。它的默认大小是128MB,通过wsrep_provider_options变量参数设置。建议调整为2G-4G范围,足够的空间便于缓存更多的增量信息。
gcache.mem_size代表Gcache中内存缓存的大小,适度调大可以提高整个集群的性能。
gcache.page_size可以理解为如果内存不够用(Gcache不足),就直接将写集写入到磁盘文件中。
PXC集群的状态监控
在集群搭建好之后,可以通过如下状态变量"%wsrep%'来查看集群中各节点的状态,
下面例举出几个重要的参数,便于发现问题。
wsrep_local_state_uid:集群中所有节点的该状态值应该是相同的,如果有不同值的节点,说明其没有加入集群。
wsrep_last_committed:最后提交的事务数目。
wsrep_cluster_size:当前集群中的节点数量。
wsrep_cluster_status:集群组成的状态。如果不是"Primary",说明出现脑裂现象。
wsrep_local_state:当前节点状态,值为4表示正常。该状态有四个值:
joining:表示节点正在加入集群
**doner:**节点处于为新加入节点提供全量数据时的状态。
joined:当前节点已成功加入集群。
synced:当前节点与集群中各节点是同步状态。
wsrep_ready:为ON表示当前节点可以正常提供服务。为OFF,则该节点可能发生脑裂或网络问题导致。
部署PXC
环境规划:
192.168.1.23 node1
192.168.1.24 node2
192.168.1.25 node3
安装PXC
下载依赖
[root@node2 ~]# yum -y install libev lsof perl-Compress-Raw-Bzip2 perl-Compress-Raw-Zlib perl-DBI perl-Digest perl-Digest-MD5 perl-IO-Compress perl-Net-Daemon perl-DBD-MySQL perl-PlRPC qpress socat openssl openssl-devel gcc gcc-c++ rsync
注意:这里有个依赖可能下载不下载,就得自己找了qpress
安装Xtrbackup
[root@node1 ~]# cd /usr/local/src/
[root@node1 src]# ls
percona-xtrabackup-24-2.4.18-1.el7.x86_64.rpm
Percona-XtraDB-Cluster-5.7.28-rel31-31.41.1.Linux.x86_64.ssl101.tar.gz
qpress-11-linux-