mycat 是mysql分库分表的中间件,由java编写,本次进行mysql、mycat 的docker搭建,理解mycat的原理与特性。
一、mysql docker 搭建
这里启动两个实例:
docker run -itd --name mysql1 -p 3307:3306 -e MYSQL_ROOT_PASSWORD=123 mysql:5.7.40
docker run -itd --name mysql2 -p 3308:3306 -e MYSQL_ROOT_PASSWORD=123 mysql:5.7.40
二、写mycat 配置
schema.xml:配置逻辑库、逻辑表、分片规则、数据结点配置。
ITCAST是逻辑库,player、team是逻辑表。
db1需要在mysql1 、mysql2 种创建。
rule1为分片规则。
172.17.0.2、172.17.0.3为mysql1 、mysql2的docker ip。
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
<!-- 逻辑库配置 -->
<schema name="ITCAST" checkSQLschema="false" sqlMaxLimit="100">
<!-- 逻辑表配置 -->
<table name="player,team" dataNode="dn1,dn2" rule="rule1"/>
</schema>
<!-- 数据节点配置 -->
<dataNode name="dn1" dataHost="host1" database="db1" />
<dataNode name="dn2" dataHost="host2" database="db1" />
<!-- 节点主机配置 -->
<dataHost name="host1" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<writeHost host="hostM1" url="172.17.0.2:3306" user="root" password="123"></writeHost>
</dataHost>
<dataHost name="host2" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<writeHost host="hostM1" url="172.17.0.3:3306" user="root" password="123"></writeHost>
</dataHost>
</mycat:schema>
rule.xml:配置一系列分片规则,我们使用rule1。按主键均匀分表。
<?xml version="1.0" encoding="UTF-8"?>
<!-- - - Licensed under the Apache License, Version 2.0 (the "License");
- you may not use this file except in compliance with the License. - You
may obtain a copy of the License at - - http://www.apache.org/licenses/LICENSE-2.0
- - Unless required by applicable law or agreed to in writing, software -
distributed under the License is distributed on an "AS IS" BASIS, - WITHOUT
WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. - See the
License for the specific language governing permissions and - limitations
under the License. -->
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
<mycat:rule xmlns:mycat="http://io.mycat/">
<tableRule name="rule1">
<rule>
<columns>id</columns>
<algorithm>crc32slot</algorithm>
</rule>
</tableRule>
<tableRule name="auto-sharding-long">
<rule>
<columns>id</columns>
<algorithm>rang-long</algorithm>
</rule>
</tableRule>
<function name="crc32slot" class="io.mycat.route.function.PartitionByCRC32PreSlot">
<property name="count">2</property><!-- 要分片的数据库节点数量,必须指定,否则没法分片 -->
</function>
<function name="rang-long" class="io.mycat.route.function.AutoPartitionByLong">
<property name="mapFile">autopartition-long.txt</property>
</function>
</mycat:rule>
server.xml:配置mycat 的用户与密码。
<?xml version="1.0" encoding="UTF-8"?>
<!-- - - Licensed under the Apache License, Version 2.0 (the "License");
- you may not use this file except in compliance with the License. - You
may obtain a copy of the License at - - http://www.apache.org/licenses/LICENSE-2.0
- - Unless required by applicable law or agreed to in writing, software -
distributed under the License is distributed on an "AS IS" BASIS, - WITHOUT
WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. - See the
License for the specific language governing permissions and - limitations
under the License. -->
<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://io.mycat/">
<system>
<property name="charset">utf8</property>
<property name="nonePasswordLogin">0</property> <!-- 0为需要密码登陆、1为不需要密码登陆 ,默认为0,设置为1则需要指定默认账户-->
<property name="ignoreUnknownCommand">0</property><!-- 0遇上没有实现的报文(Unknown command:),就会报错、1为忽略该报文,返回ok报文。
在某些mysql客户端存在客户端已经登录的时候还会继续发送登录报文,mycat会报错,该设置可以绕过这个错误-->
<property name="useHandshakeV10">1</property>
<property name="removeGraveAccent">1</property>
<property name="useSqlStat">0</property> <!-- 1为开启实时统计、0为关闭 -->
<property name="useGlobleTableCheck">0</property> <!-- 1为开启全加班一致性检测、0为关闭 -->
<property name="sqlExecuteTimeout">300</property> <!-- SQL 执行超时 单位:秒-->
<property name="sequnceHandlerType">1</property>
<!--<property name="sequnceHandlerPattern">(?:(\s*next\s+value\s+for\s*MYCATSEQ_(\w+))(,|\)|\s)*)+</property>
INSERT INTO `travelrecord` (`id`,user_id) VALUES ('next value for MYCATSEQ_GLOBAL',"xxx");
-->
<!--必须带有MYCATSEQ_或者 mycatseq_进入序列匹配流程 注意MYCATSEQ_有空格的情况-->
<property name="sequnceHandlerPattern">(?:(\s*next\s+value\s+for\s*MYCATSEQ_(\w+))(,|\)|\s)*)+</property>
<property name="subqueryRelationshipCheck">false</property> <!-- 子查询中存在关联查询的情况下,检查关联字段中是否有分片字段 .默认 false -->
<property name="sequenceHanlderClass">io.mycat.route.sequence.handler.HttpIncrSequenceHandler</property>
<!-- <property name="useCompression">1</property>--> <!--1为开启mysql压缩协议-->
<!-- <property name="fakeMySQLVersion">5.6.20</property>--> <!--设置模拟的MySQL版本号-->
<!-- <property name="processorBufferChunk">40960</property> -->
<!--
<property name="processors">1</property>
<property name="processorExecutor">32</property>
-->
<!--默认为type 0: DirectByteBufferPool | type 1 ByteBufferArena | type 2 NettyBufferPool -->
<property name="processorBufferPoolType">0</property>
<!--默认是65535 64K 用于sql解析时最大文本长度 -->
<!--<property name="maxStringLiteralLength">65535</property>-->
<!--<property name="sequnceHandlerType">0</property>-->
<!--<property name="backSocketNoDelay">1</property>-->
<!--<property name="frontSocketNoDelay">1</property>-->
<!--<property name="processorExecutor">16</property>-->
<!--
<property name="serverPort">8066</property> <property name="managerPort">9066</property>
<property name="idleTimeout">300000</property> <property name="bindIp">0.0.0.0</property>
<property name="dataNodeIdleCheckPeriod">300000</property> 5 * 60 * 1000L; //连接空闲检查
<property name="frontWriteQueueSize">4096</property> <property name="processors">32</property> -->
<!--分布式事务开关,0为不过滤分布式事务,1为过滤分布式事务(如果分布式事务内只涉及全局表,则不过滤),2为不过滤分布式事务,但是记录分布式事务日志-->
<property name="handleDistributedTransactions">0</property>
<!--
off heap for merge/order/group/limit 1开启 0关闭
-->
<property name="useOffHeapForMerge">0</property>
<!--
单位为m
-->
<property name="memoryPageSize">64k</property>
<!--
单位为k
-->
<property name="spillsFileBufferSize">1k</property>
<property name="useStreamOutput">0</property>
<!--
单位为m
-->
<property name="systemReserveMemorySize">384m</property>
<!--是否采用zookeeper协调切换 -->
<property name="useZKSwitch">false</property>
<!-- XA Recovery Log日志路径 -->
<!--<property name="XARecoveryLogBaseDir">./</property>-->
<!-- XA Recovery Log日志名称 -->
<!--<property name="XARecoveryLogBaseName">tmlog</property>-->
<!--如果为 true的话 严格遵守隔离级别,不会在仅仅只有select语句的时候在事务中切换连接-->
<property name="strictTxIsolation">false</property>
<property name="useZKSwitch">true</property>
<!--如果为0的话,涉及多个DataNode的catlet任务不会跨线程执行-->
<property name="parallExecute">0</property>
</system>
<!-- 全局SQL防火墙设置 -->
<!--白名单可以使用通配符%或着*-->
<!--例如<host host="127.0.0.*" user="root"/>-->
<!--例如<host host="127.0.*" user="root"/>-->
<!--例如<host host="127.*" user="root"/>-->
<!--例如<host host="1*7.*" user="root"/>-->
<!--这些配置情况下对于127.0.0.1都能以root账户登录-->
<!--
<firewall>
<whitehost>
<host host="1*7.0.0.*" user="root"/>
</whitehost>
<blacklist check="false">
</blacklist>
</firewall>
-->
<user name="root">
<property name="password">123456</property>
<property name="schemas">ITCAST</property>
</user>
<user name="test">
<property name="password">123456</property>
<property name="schemas">ITCAST</property>
</user>
</mycat:server>
三、docker 启动mycat
在当前目录下,创建mycat/conf 目录,并将schema.xml rule.xml server.xml 放入其中。
docker run -itd --name mycat -p 8066:8066 -p 9066:9066 -v `pwd`/my_cat/conf/schema.xml:/usr/local/mycat/conf/schema.xml -v `pwd`/my_cat/conf/rule.xml:/usr/local/mycat/conf/rule.xml -v `pwd`/my_cat/conf/server.xml:/usr/local/mycat/conf/server.xml longhronshens/mycat-docker
四、建库
连接mycat,输入123456
此时,ITCAST逻辑库已存在,逻辑表也存在。但mysql1、mysql2 中没有这两张表。
建表:
此时再看mysql1、mysql2,表就出现了。
插入数据:
insert into player(id,name,team_id) values(1,'name_aa',1);
insert into player(id,name,team_id) values(2,'name_bb',1);
insert into player(id,name,team_id) values(3,'name_cc',3);
insert into team(id,name) values(1,'team_aa');
insert into team(id,name) values(2,'team_bb');
insert into team(id,name) values(3,'team_cc');
其中:
id为1、3的数据分配到mysql1 中。
id为2的数据分配到mysql2 中。
mysql1:
mysql2:
五、打开mysql SQL执行日志。
临时打开:
mysql> SET GLOBAL general_log = 'ON';
日志文件路径:
mysql> show variables like '%general_log_file%';
六、mycat不适用场景的验证
1.非分片键的查询将扩散至所有结点。
使用a、b 对照试验,a按分片键查找,b不按分片键查找。
a.
在mycat 执行:
mysql> select * from player where id=1;
查看mysql1、mysql2 日志:
mysql1:
mysql2:
26秒~36秒间无其他操作。
b.
在mycat 执行:
mysql> select * from player where name like '%_aa';
查看mysql1、mysql2 日志:
mysql1:
mysql2:
2.分页排序将性能下降。
limit m,n 的分页查询将对每个结点发起limit m+n / limit 0,m+n的查询,然后等所有结点数据返回后,根据m+n 构造最小堆,最后取最小堆中的最大的n个。
在mycat 执行:
mysql> select * from player order by id limit 1,1;
必须加order,否则返回的数据将是不准确的。
mysql1:
mysql2:
3.表连接将无法进行。
在mycat 中执行:
mysql> select player.name name,team.name team_name from player left join team on player.team_id = team.id where player.id=2;
查询id=2 的运动员的姓名和队名,这在单表中一定能轻松查出来。但在mycat下就有问题:
原因这条语句,mycat只发往了mysql2:
mysql1 无任何执行:
因为mysql2 中没有队伍3的数据,所以id=2的队员没有查出对应的队伍。
六、mycat适用场景
1.单纯的读写分离,此时配置最为简单,支持读写分离,主从切换。
2.分表分库,对于超过 1000 万的表进行分片,最大支持 1000 亿的单表分片。
3.多租户应用,每个应用一个库,但应用程序只连接 Mycat,从而不改造程序本身,实现多租户化
4.报表系统,借助于 Mycat 的分表能力,处理大规模报表的统计;
5.作为海量数据实时查询的一种简单有效方案,比如 100 亿条频繁查询的记录需要在 3 秒内查询出来结果,除了基于主键的查询,还可能存在范围查询或其他属性查询,此时 Mycat 可能是最简单有效的选择。
七、其他
随着业务的发展,核心数据越来越多,TPS越来越高,数据库的主从、分库分表将不能满足需求,需要引入可水平拓展的分布式事务数据库,如TiDB、GuassDB等。
references: