一、Mycat是什么
MyCat是一个开源的分布式数据库系统,是一个实现了MySQL协议的服务器,前端用户可以把它看作是一个数据库代理,用MySQL客户端工具和命令行访问,而其后端可以用MySQL原生协议与多个MySQL服务器通信,也可以用JDBC协议与大多数主流数据库服务器通信,其核心功能是分表分库,即将一个大表水平分割为N个小表,存储在后端MySQL服务器里或者其他数据库里。
MyCat发展到目前的版本,已经不是一个单纯的MySQL代理了,它的后端可以支持MySQL、SQL Server、Oracle、DB2、PostgreSQL等主流数据库,也支持MongoDB这种新型NoSQL方式的存储,未来还会支持更多类型的存储。而在最终用户看来,无论是那种存储方式,在MyCat里,都是一个传统的数据库表,支持标准的SQL语句进行数据的操作,这样一来,对前端业务系统来说,可以大幅降低开发难度,提升开发速度。
我们的应用只需要一台数据库服务器的时候我们并不需要Mycat,而如果你需要分库甚至分表,这时候应用要面对很多个数据库的时候,这个时候就需要对数据库层做一个抽象,来管理这些数据库,而最上面的应用只需要面对一个数据库层的抽象或者说数据库中间件就好了,这就是Mycat的核心作用。
对于开发人员来说,可以这么理解Mycat:
Mycat就是一个近似于MySQL的数据库服务器,你可以用连接MySQL的方式去连接MyCat(除了端口不同,MyCat默认的端口是8066,而MySQL是3306),大多数情况下,你可以用你熟悉对的对象映射框架,比如MyBatis操作Mycat。
总结:Mycat是一个广受好评的数据库中间件,为了减轻单数据库的压力,可以实现主从、热备、分表分库,从而实现数据库的分布式架构。
二、Mycat主要能做什么
2.1数据库的读写分离
通过Mycat可以自动实现写数据时操作主数据库,读数据时操作从数据库;从而实现读写分离,当主出现故障后,Mycat自动切换到另一个主上,进而提供高可用的数据库服务,当然我们需要部署多主多从的模式
2.2数据库的分库分表
当我们的单个表的数据量比较大,或者当我们的数据库表比较多,我们可以采用mycat提供的分库分表支持,实现对数据库的水平及垂直扩展;
三、Mycat原理
Mycat的原理中最重要的一个动词是“拦截”,它拦截了用户发送过来的SQL语句,首先对SQL语句做了一些特定的分析:如分片分析、路由分析、读写分离分析、缓存分析等,然后将此SQL发往后端的真实数据库,并将返回的结果做适当的处理,最终再返回给用户。
3.1架构图
3.2高可用的方案
四、Mycat安装步骤
4.1.环境规划
服务器名称 | 服务器IP地址 | 描述 |
mycat服务器 | 47.96.126.113 | mycat中间件服务器 |
mysql服务器 | 121.40.137.76 | 物理数据库1,真正存储数据的数据库,这里为Master主数据库 |
mysql服务器 | 121.40.176.120 | 物理数据库2,真正存储数据的数据库,这里为Slave主数据库 |
4.2.软件准备
操作系统是centos6.9版本,mysql安装包、jdk安装包、mycat安装包,具体的软件可从下面链接下载
链接:https://pan.baidu.com/s/1bBMu1R5rWVoxQ5A9IfR1zg
提取码:ykqj
4.3.软件安装
Mycat读写分离和自动切换机制,需要mysql的主从复制机制配合,所以首先我们需要做mysql的主从复制,再做读写分离。主从复制可以参考上篇的博客,这里不再重复阐述,我们之间用Mycat配置读写分离,具体步骤如下:
yum install -y jdk-8u221-linux-x64.rpm
tar -zxvf Mycat-server-1.6-RELEASE-20161028204710-linux.tar.gz
解压后即安装完成,到mycat的bin目录下执行如下命令
Mycat启动./mycat start
Mycat关闭./mycat stop
登录Mycat命令行
mysql -u登录用户 -p -P端口 -hmycat服务器IP地址
如:mysql -uroot -p -P8066 -h127.0.0.1
我们可以用./mycat console命令直接启用(如果推出mycat也将会停用)
4.4.文件配置
先看mycat的安装目录
Mycat的配置文件都在conf目录里面,这里介绍几个常用的文件:
server.xml Mycat的配置文件,设置账号、参数等
schema.xml Mycat对应的物理数据库和数据库表的配置
rule.xml Mycat分片(分库分表)规则
server.xml文件其实跟读写分离策略关系不大,但是需要用此文件来配置连接MyCat的用户及权限等,因此在这里简单说明。
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://io.mycat/">
<!--这个标签内嵌套的所有 property 标签都与系统配置有关。-->
<system>
<property name="useSqlStat">0</property> <!-- 1为开启实时统计、0为关闭 -->
<property name="useGlobleTableCheck">0</property> <!-- 1为开启全加班一致性检测、0为关闭 -->
<property name="sequnceHandlerType">2</property>
<!-- <property name="useCompression">1</property>--> <!--1为开启mysql压缩协议-->
<!-- <property name="fakeMySQLVersion">5.6.20</property>--> <!--设置模拟的MySQL版本号-->
<!-- <property name="processorBufferChunk">40960</property> -->
<!--
<property name="processors">1</property>
<property name="processorExecutor">32</property>
-->
<!--默认为type 0: DirectByteBufferPool | type 1 ByteBufferArena-->
<property name="processorBufferPoolType">0</property>
<!--默认是65535 64K 用于sql解析时最大文本长度 -->
<!--<property name="maxStringLiteralLength">65535</property>-->
<!--<property name="sequnceHandlerType">0</property>-->
<!--<property name="backSocketNoDelay">1</property>-->
<!--<property name="frontSocketNoDelay">1</property>-->
<!--<property name="processorExecutor">16</property>-->
<!--
<property name="serverPort">8066</property> <property name="managerPort">9066</property>
<property name="idleTimeout">300000</property> <property name="bindIp">0.0.0.0</property>
<property name="frontWriteQueueSize">4096</property> <property name="processors">32</property> -->
<!--分布式事务开关,0为不过滤分布式事务,1为过滤分布式事务(如果分布式事务内只涉及全局表,则不过滤),2为不过滤分布式事务,但是记录分布式事务日志-->
<property name="handleDistributedTransactions">0</property>
<!--off heap for merge/order/group/limit 1开启 0关闭-->
<property name="useOffHeapForMerge">1</property>
<!--单位为m-->
<property name="memoryPageSize">1m</property>
<!--单位为k-->
<property name="spillsFileBufferSize">1k</property>
<property name="useStreamOutput">0</property>
<!--单位为m-->
<property name="systemReserveMemorySize">384m</property>
<!--是否采用zookeeper协调切换 -->
<property name="useZKSwitch">true</property>
</system>
<!-- 全局SQL防火墙设置 -->
<!--
<firewall>
<whitehost>
<host host="127.0.0.1" user="mycat"/>
<host host="127.0.0.2" user="mycat"/>
</whitehost>
<blacklist check="false">
</blacklist>
</firewall>
-->
<!--
user标签 用户配置节点
--name 登录的用户名,也就是连接Mycat的用户名
--password 登录的密码,也就是连接Mycat的密码
--schemas 数据库名,这里会和schema.xml中的配置关联,多个用逗号分开,例如需要这个用户需要管理两个数据库db1,db2,则配置db1,dbs
-->
<user name="root">
<property name="password">pass</property>
<property name="schemas">TESTDB</property>
<!-- privileges标签是对用户的 schema以及表进行精细化的DML权限控制
--check 表示是否开启DML权限检查。默认是关闭。server.dtd文件中 <!ELEMENT privileges (schema)*> 说明可以有多个schema的配置。
--dml 顺序说明:insert,update,select,delete
TESTDB的权限是update,select。
tb01的权限是啥都不能干。
tb02的权限是insert,update,select,delete。
其他表默认是udpate,select。
-->
<!--
<privileges check="false">
<schema name="TESTDB" dml="0110" >
<table name="tb01" dml="0000"></table>
<table name="tb02" dml="1111"></table>
</schema>
</privileges>
-->
</user>
<user name="user">
<property name="password">pass</property>
<property name="schemas">TESTDB</property>
<property name="readOnly">true</property>
</user>
</mycat:server>
schema.xml是最主要的配置项,此文件关联mysql读写分离策略!读写分离、分库分表策略、分片节点都是在此文件中配置的!
MyCat作为中间件,它只是一个代理,本身并不进行数据存储,需要连接后端的MySQL物理服务器,此文件就是用来连接MySQL服务器的!
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
<!--
schema标签用来定义mycat实例中的逻辑库,mycat可以有多个逻辑库,每个逻辑库都有自己的相关配置。可以使用schema标签来划分这些不同的逻辑库
如果不配置schema标签,所有表的配置会属于同一个默认的逻辑库。逻辑库的概念和MySql的database的概念一样,我们在查询两个不同逻辑库中的表的时候,需要切换到该逻辑库下进行查询。
--name 逻辑数据库名,与server.xml中的schema对应
--checkSQLschema 数据库前缀相关设置,当该值为true时,例如我们执行语句select * from TESTDB.company 。mycat会把语句修改为 select * from company 去掉TESTDB。
--sqlMaxLimit 当该值设置为某个数值时,每条执行的sql语句,如果没有加上limit语句,Mycat会自动加上对应的值。不写的话,默认返回所有的值。
需要注意的是,如果运行的schema为非拆分库的,那么该属性不会生效。需要自己sql语句加limit。-->
<schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100" dataNode="dn1">
</schema>
<!-- datanode标签定义了mycat中的数据节点,也就是我们所说的数据分片。一个datanode标签就是一个独立的数据分片。
例子中的表述的意思为,使用名字为localhost1数据库实例上的db1物理数据库,这就组成一个数据分片,最后我们用dn1来标示这个分片。
--name 定义数据节点的名字,这个名字需要唯一。我们在table标签上用这个名字来建立表与分片对应的关系
--dataHost 用于定义该分片属于哪个数据库实例,属性与datahost标签上定义的name对应
--database 用于定义该分片属于数据库实例上 的具体库。-->
<dataNode name="dn1" dataHost="localhost1" database="test" />
<!--
这个标签直接定义了具体数据库实例,读写分离配置和心跳语句。
--name 唯一标示dataHost标签,供上层使用
--maxCon 指定每个读写实例连接池的最大连接。
--minCon 指定每个读写实例连接池的最小连接,初始化连接池的大小
--balance 负载均称类型
balance="0":不开启读写分离机制,所有读操作都发送到当前可用的writeHost上
balance="1":全部的readHost与stand by writeHost参与select语句的负载均衡,简单的说,当双主双从模式(M1-S1,M2-S2 并且M1 M2互为主备),正常情况下,M2,S1,S2都参与select语句的负载均衡。
balance="2":所有读操作都随机的在writeHost、readHost上分发
balance="3":所有读请求随机的分发到writeHst对应的readHost执行,writeHost不负担读写压力。(1.4之后版本有)
--writeType 负载均衡类型。
writeType="0", 所有写操作发送到配置的第一个 writeHost,第一个挂了切到还生存的第二个writeHost,重新启动后已切换后的为准,切换记录在配置文件中:dnindex.properties .
writeType="1",所有写操作都随机的发送到配置的 writeHost。1.5以后版本废弃不推荐。
--switchType -1不自动切换
1 默认值 自动切换
2 基于MySql主从同步的状态决定是否切换心跳语句为 show slave status
3 基于mysql galary cluster 的切换机制(适合集群)1.4.1 心跳语句为 show status like 'wsrep%'
--dbType 指定后端链接的数据库类型目前支持二进制的mysql协议,还有其他使用jdbc链接的数据库,例如:mongodb,oracle,spark等
--dbDriver 指定连接后段数据库使用的driver,目前可选的值有native和JDBC。使用native的话,因为这个值执行的是二进制的mysql协议,所以可以使用mysql和maridb,其他类型的则需要使用JDBC驱动来支持。
如果使用JDBC的话需要符合JDBC4标准的驱动jar 放到mycat\lib目录下,并检查驱动jar包中包括如下目录结构文件 META-INF\services\java.sql.Driver。 在这个文件写上具体的driver类名,例如com.mysql.jdbc.Driver
writeHost readHost指定后端数据库的相关配置给mycat,用于实例化后端连接池。
--tempReadHostAvailable
如果配置了这个属性 writeHost 下面的 readHost 仍旧可用,默认 0 可配置(0、1)。
1)heartbeat标签
这个标签内指明用于和后端数据库进行心跳检查的语句。
例如:MYSQL 可以使用 select user(),Oracle 可以使用 select 1 from dual 等。
2) writeHost /readHost 标签
这两个标签都指定后端数据库的相关配置,用于实例化后端连接池。唯一不同的是,writeHost 指定写实例、readHost 指定读实例。
在一个 dataHost 内可以定义多个 writeHost 和 readHost。但是,如果 writeHost 指定的后端数据库宕机,那么这个 writeHost 绑定的所有 readHost 都将不可用。
另一方面,由于这个 writeHost 宕机,系统会自动的检测到,并切换到备用的 writeHost 上去。这两个标签的属性相同,这里就一起介绍。
--host 用于标识不同实例,一般 writeHost 我们使用*M1,readHost 我们用*S1。
--url 后端实例连接地址。Native:地址:端口 JDBC:jdbc的url
--password 后端存储实例需要的密码
--user 后端存储实例需要的用户名字
--weight 权重 配置在 readhost 中作为读节点的权重
--usingDecrypt 是否对密码加密,默认0。具体加密方法看官方文档。
-->
<dataHost name="localhost1" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<!-- can have multi write hosts -->
<writeHost host="hostM1" url="121.40.137.76:3306" user="root"
password="pass">
<!-- can have multi read hosts -->
<readHost host="hostS2" url="121.40.176.120:3306" user="root" password="pass" />
</writeHost>
</dataHost>
</mycat:schema>
五、读写分离测试
将mycat的日志输出级别改完debug(默认是info级别),在conf
/log4j2
.xml里配置,然后去查询去添加数据在
/logs/mycat
.log日志文件里查看sql被路由到了哪个服务器上
特别注意:查询语句不要加事务,否则读操作会被分发到写服务器上。
我们打开navicat软件连接mycat,用户名为root,密码pass,端口号为8806(在上面的server.xml配置的),然后再执行插入语句
INSERT INTO t_users(user_id,user_email,user_password,user_nikename,user_creatime,user_status,user_deleteflag)
VALUES(6,'5555@qq.com','12345','zhangliu',NOW(),1,0);
运行成功后,我们可以看到数据已经插入到物理库里,那到底插入的是哪个物理库,我们可以看mycat目录下的logs日志,在看日志之前首先我们需要修改日志打印的等级。
重启mycat服务(注意:先修改日志级别,再重启mycat服务,再执行插入的sql语句,最后看执行的日志)
然后查看mycat.log的debug日志,观察mysql的sql被路由到了哪个服务器上了(下面日志中的121.40.137.76是远程客户机的ip地址)。
我们再执行以下查询的SQL语句
SELECT * FROM `t_users`;
我可以看到查询和插入分别操作的是两个不同IP的数据库,我们的读写分离成功完成!
如果需要主从切换,即主服务器挂了,从服务器变成主服务器,只需要修改一下schema.xml文件,在datahost标签下添加
<writeHost host="Mysql-node2" url="121.40.176.120:3306" user="root" password="123456"></writeHost>内容即可。具体如下
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
<schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100" dataNode="dn1">
</schema>
<dataNode name="dn1" dataHost="localhost1" database="test" />
<dataHost name="localhost1" maxCon="1000" minCon="10" balance="1"
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<!-- can have multi write hosts -->
<writeHost host="hostM1" url="121.40.137.76:3306" user="root"
password="pass">
<!-- can have multi read hosts -->
<readHost host="hostS2" url="121.40.176.120:3306" user="root" password="pass" />
</writeHost>
<writeHost host="Mysql-node2" url="121.40.176.120:3306" user="root" password="123456"></writeHost>
</dataHost>
</mycat:schema>