分库分表：MyCat+MySQL实现数据库分片

最新推荐文章于 2023-06-02 14:30:47 发布

chq0910

最新推荐文章于 2023-06-02 14:30:47 发布

阅读量129

点赞数

文章标签：数据库 java 运维

原文链接：https://my.oschina.net/u/925119/blog/1796121

版权

一、MyCat相关

Mycat的架构其实很好理解，Mycat是代理，Mycat后面就是物理数据库。和Web服务器的Nginx类似。对于使用者来说，访问的都是Mycat，不会接触到后端的数据库。

Mycat官网：http://www.mycat.io/

Mycat下载地址：http://dl.mycat.io/

根据不同的系统选择不同的版本，下载解压即可：

目录	说明
bin	mycat命令，启动、重启、停止等
catlet	catlet为Mycat的一个扩展功能
conf	Mycat 配置信息,重点关注
lib	Mycat引用的jar包，Mycat是java开发的
logs	日志文件，包括Mycat启动的日志和运行的日志。

配置

Mycat的配置文件都在conf目录里面，这里介绍几个常用的文件：

文件	说明
server.xml	Mycat的配置文件，设置账号、参数等
schema.xml	Mycat对应的物理数据库和数据库表的配置
rule.xml	Mycat分片（分库分表）规则

启动

Mycat的启动也很简单，启动命令在Bin目录：

./mycat { console | start | stop | restart | status | dump }

二、Mycat 常用配置

server.xml

说明：设置MyCat的用户名和密码，配置root/user两个用户,其中user只读权限,对应的数据库为TESTDB

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://io.mycat/">
	<system>
	<property name="useSqlStat">0</property>  <!-- 1为开启实时统计、0为关闭 -->
	<property name="useGlobleTableCheck">0</property>  <!-- 1为开启全加班一致性检测、0为关闭 -->
		<property name="sequnceHandlerType">2</property>
		<!--默认为type 0: DirectByteBufferPool | type 1 ByteBufferArena-->
		<property name="processorBufferPoolType">0</property>
		<!--默认是65535 64K 用于sql解析时最大文本长度 -->
		
		<!--分布式事务开关，0为不过滤分布式事务，1为过滤分布式事务（如果分布式事务内只涉及全局表，则不过滤），2为不过滤分布式事务,但是记录分布式事务日志-->
		<property name="handleDistributedTransactions">0</property>
		<property name="useOffHeapForMerge">1</property>
		<property name="memoryPageSize">1m</property>
		<property name="spillsFileBufferSize">1k</property>
		<property name="useStreamOutput">0</property>
		<property name="systemReserveMemorySize">384m</property>
		<property name="useZKSwitch">true</property>

		<property name="defaultSqlParser">druidparser</property>  
        <property name="mutiNodeLimitType">1</property>  
        <property name="serverPort">8066</property>  
        <property name="managerPort">9066</property> 
	</system>
	
	<!-- 全局SQL防火墙设置 -->
	<!-- 
	<firewall> 
	   <whitehost>
	      <host host="127.0.0.1" user="mycat"/>
	      <host host="127.0.0.2" user="mycat"/>
	   </whitehost>
       <blacklist check="false">
       </blacklist>
	</firewall>
	-->
	
	<!-- 任意设置登陆 mycat 的用户名,密码,数据库  -->  
	<user name="root">
		<property name="password">123456</property>
		<property name="schemas">TESTDB</property>
		
		<!-- 表级 DML 权限设置 -->
		<!-- 		
		<privileges check="false">
			<schema name="TESTDB" dml="0110" >
				<table name="tb01" dml="0000"></table>
				<table name="tb02" dml="1111"></table>
			</schema>
		</privileges>		
		 -->
	</user>

	<user name="user">
		<property name="password">user</property>
		<property name="schemas">TESTDB</property>
		<property name="readOnly">true</property>
	</user>

</mycat:server>

schema.xml

说明：配置login_info表对应的分库配置以及分片规则，分片规则为rang-long-login，具体实现在rule.xml

<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">

	<!-- 设置表的存储方式.schema name="TESTDB" 与 server.xml中的 TESTDB 设置一致  -->
	<!-- name:逻辑数据库名，与server.xml中的schema对应 -->
	<!-- checkSQLschema:数据库前缀相关设置，建议看文档，这里暂时设为false -->
	<!-- sqlMaxLimit:select 时默认的limit，避免查询全表 -->
	<schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100">
		
		<!-- name:表名，物理数据库中表名 -->
		<!-- dataNode:表存储到哪些节点，多个节点用逗号分隔。节点为下文dataNode设置的name -->
		<!-- primaryKey:主键字段名，自动生成主键时需要设置 -->
		<!-- autoIncrement:是否自增 -->
		<!-- rule:分片规则名，具体规则下文rule详细介绍 -->
		<!-- <table name="seal_status_info" primaryKey="seal_id" type="global" dataNode="node_db01" />  

        <table name="seal_status_info" primaryKey="seal_id" dataNode="node_db02,node_db03" rule="rang-long-wwm">   -->
        		<!-- name：定义子表的表名 -->
        		<!-- joinKey：插入子表的时候会使用这个列的值查找父表存储的数据节点 -->
        		<!-- parentKey:属性指定的值一般为与父表建立关联关系的列名。程序首先获取 joinkey 的值，再通过 parentKey 属性指定 的列名产生查询语句，通过执行该语句得到父表存储在哪个分片上。从而确定子表存储的位置。 -->
                <!-- <childTable name="item_detail" primaryKey="id" joinKey="item_id" parentKey="id" />  
        </table>  -->

        <table name="login_info" primaryKey="id" dataNode="node_db01,node_db02,node_db03" rule="rang-long-login" >
        	<childTable name="user_info" primaryKey="id" joinKey="login_id" parentKey="id" />
        </table>  
	</schema>

	<!-- 分片配置-分库相关配置 -->
	<!-- name:节点名，与table中dataNode对应 -->
	<!-- datahost:物理数据库名，与datahost中name对应 -->
	<!-- database:物理数据库中数据库名[真实的数据名] -->
	<!-- 设置dataNode 对应的数据库,及 mycat 连接的地址dataHost -->  
    <dataNode name="node_db01" dataHost="dataHost01" database="test01" />  
    <dataNode name="node_db02" dataHost="dataHost01" database="test02" />  
    <dataNode name="node_db03" dataHost="dataHost01" database="test03" />

	<!-- 物理数据库配置-真正存储数据的数据库 -->
	<!-- name:物理数据库名，与dataNode中dataHost对应 -->
	<!-- balance:均衡负载的方式 -->
	<!-- writeType:写入方式 -->
	<!-- dbType:数据库类型 -->
	<!-- heartbeat:心跳检测语句，注意语句结尾的分号要加。 -->
	<!-- 读写分离 writeHost:写库 readHost：读库  -->
	<!-- 注意：Mycat主从分离只是在读的时候做了处理，写入数据的时候，只会写入到writehost，需要通过mycat的主从复制将数据复制到readhost，这个问题当时候我纠结了好久，数据写入writehost后，readhost一直没有数据，以为是自己配置的问题，后面才发现Mycat就没有实现主从复制的功能，毕竟数据库本身自带的这个功能才是最高效稳定的。 -->
	<!-- <dataHost name="localhost1" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100">
		<heartbeat>select user();</heartbeat>
		<writeHost host="hostM1" url="localhost:3306" user="root" password="123456">
			<readHost host="hostS2" url="192.168.1.200:3306" user="root" password="xxx" />
		</writeHost>
		<writeHost host="hostS1" url="localhost:3316" user="root" password="123456" />
	</dataHost>
 -->
	<!-- mycat 逻辑主机dataHost对应的物理主机.其中也设置对应的mysql登陆信息 -->  
    <dataHost name="dataHost01" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native">  
            <heartbeat>select user();</heartbeat>  
            <writeHost host="server1" url="127.0.0.1:3306" user="wwm" password="Eivish0204."/>  
    </dataHost>
	
</mycat:schema>

rule.xml

说明：定义分片规则rang-long-login，按字段id进行分片，对应的规则在autopartition-login.txt文件

<?xml version="1.0" encoding="UTF-8"?>
<!-- - - Licensed under the Apache License, Version 2.0 (the "License"); 
	- you may not use this file except in compliance with the License. - You 
	may obtain a copy of the License at - - http://www.apache.org/licenses/LICENSE-2.0 
	- - Unless required by applicable law or agreed to in writing, software - 
	distributed under the License is distributed on an "AS IS" BASIS, - WITHOUT 
	WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. - See the 
	License for the specific language governing permissions and - limitations 
	under the License. -->
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
<mycat:rule xmlns:mycat="http://io.mycat/">
	<tableRule name="rule1">
		<!-- columns:指定分片列的列名 -->
		<!-- algorithm:选择分片算法（function标签中的name属性） -->
		<rule>
			<columns>id</columns>
			<algorithm>func1</algorithm>
		</rule>
	</tableRule>

	<tableRule name="rule2">
		<rule>
			<columns>user_id</columns>
			<algorithm>func1</algorithm>
		</rule>
	</tableRule>

	<tableRule name="sharding-by-intfile">
		<rule>
			<columns>sharding_id</columns>
			<algorithm>hash-int</algorithm>
		</rule>
	</tableRule>
	<tableRule name="auto-sharding-long">
		<rule>
			<columns>id</columns>
			<algorithm>rang-long</algorithm>
		</rule>
	</tableRule>
	<tableRule name="mod-long">
		<rule>
			<columns>id</columns>
			<algorithm>mod-long</algorithm>
		</rule>
	</tableRule>
	<tableRule name="sharding-by-murmur">
		<rule>
			<columns>id</columns>
			<algorithm>murmur</algorithm>
		</rule>
	</tableRule>
	<tableRule name="crc32slot">
		<rule>
			<columns>id</columns>
			<algorithm>crc32slot</algorithm>
		</rule>
	</tableRule>
	<tableRule name="sharding-by-month">
		<rule>
			<columns>create_time</columns>
			<algorithm>partbymonth</algorithm>
		</rule>
	</tableRule>
	<tableRule name="latest-month-calldate">
		<rule>
			<columns>calldate</columns>
			<algorithm>latestMonth</algorithm>
		</rule>
	</tableRule>
	
	<tableRule name="auto-sharding-rang-mod">
		<rule>
			<columns>id</columns>
			<algorithm>rang-mod</algorithm>
		</rule>
	</tableRule>
	
	<tableRule name="jch">
		<rule>
			<columns>id</columns>
			<algorithm>jump-consistent-hash</algorithm>
		</rule>
	</tableRule>

	<tableRule name="rang-long-login">
         <rule>
              <columns>id</columns>
              <algorithm>rang-long-login</algorithm>
        </rule>
    </tableRule>

	<tableRule name="rang-long-info">
         <rule>
              <columns>seal_no</columns>
              <algorithm>rang-long-info</algorithm>
        </rule>
    </tableRule>

     <function name="rang-long-login" class="io.mycat.route.function.AutoPartitionByLong">
            <property name="mapFile">autopartition-login.txt</property>
            <property name="defaultNode">0</property> 
            <property name="type">0</property>
    </function>

    <function name="rang-long-info" class="io.mycat.route.function.AutoPartitionByLong">
            <property name="mapFile">autopartition-info.txt</property>
            <property name="defaultNode">0</property> 
            <property name="type">0</property>
    </function>

	<!-- count:分片数，需要分成多少片 -->
	<!-- mapFile:范围分片时使用的规则 -->
	<!-- type:默认值是0，表示分片列的值是整数，非0表示是字符串。 -->
	<function name="murmur"
		class="io.mycat.route.function.PartitionByMurmurHash">
		<property name="seed">0</property><!-- 默认是0 -->
		<property name="count">2</property><!-- 要分片的数据库节点数量，必须指定，否则没法分片 -->
		<property name="virtualBucketTimes">160</property><!-- 一个实际的数据库节点被映射为这么多虚拟节点，默认是160倍，也就是虚拟节点数是物理节点数的160倍 -->
		<!-- <property name="weightMapFile">weightMapFile</property> 节点的权重，没有指定权重的节点默认是1。以properties文件的格式填写，以从0开始到count-1的整数值也就是节点索引为key，以节点权重值为值。所有权重值必须是正整数，否则以1代替 -->
		<!-- <property name="bucketMapPath">/etc/mycat/bucketMapPath</property> 
			用于测试时观察各物理节点与虚拟节点的分布情况，如果指定了这个属性，会把虚拟节点的murmur hash值与物理节点的映射按行输出到这个文件，没有默认值，如果不指定，就不会输出任何东西 -->
	</function>

	<function name="crc32slot"
			  class="io.mycat.route.function.PartitionByCRC32PreSlot">
		<property name="count">2</property><!-- 要分片的数据库节点数量，必须指定，否则没法分片 -->
	</function>
	<function name="hash-int"
		class="io.mycat.route.function.PartitionByFileMap">
		<property name="mapFile">partition-hash-int.txt</property>
	</function>

	<function name="rang-long" class="io.mycat.route.function.AutoPartitionByLong">
		<property name="mapFile">autopartition-long.txt</property>
	</function>

	<function name="mod-long" class="io.mycat.route.function.PartitionByMod">
		<!-- how many data nodes -->
		<property name="count">3</property>
	</function>

	<function name="func1" class="io.mycat.route.function.PartitionByLong">
		<property name="partitionCount">8</property>
		<property name="partitionLength">128</property>
	</function>

	<function name="latestMonth" class="io.mycat.route.function.LatestMonthPartion">
		<property name="splitOneDay">24</property>
	</function>

	<function name="partbymonth" class="io.mycat.route.function.PartitionByMonth">
		<property name="dateFormat">yyyy-MM-dd</property>
		<property name="sBeginDate">2015-01-01</property>
	</function>
	
	<function name="rang-mod" class="io.mycat.route.function.PartitionByRangeMod">
        	<property name="mapFile">partition-range-mod.txt</property>
	</function>
	
	<function name="jump-consistent-hash" class="io.mycat.route.function.PartitionByJumpConsistentHash">
		<property name="totalBuckets">3</property>
	</function>
</mycat:rule>

autopartition-login.txt

说明：0-1000属于分区0，1000-2000属于分区1，2000-3000属于分区3...

分区0，1，2对应schema.xml配置中dataNode值列表

# range start-end ,data node index
# K=1000,M=10000.
0-1K=0
1K-2K=1
2K-3K=2

三、分库分片测试

创建三个库，每个库创建一样的表。数据库脚本如下：

CREATE database test01;
CREATE database test02;
CREATE database test03;

DROP TABLE IF EXISTS `login_info`;
DROP TABLE IF EXISTS `user_info`;

CREATE TABLE `login_info` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键ID',
  `account` varchar(64) NOT NULL COMMENT '登录账号',
  `password` varchar(32) NOT NULL COMMENT '登录密码',
  `no` varchar(32) NOT NULL COMMENT '登录密码',
  `create_time` varchar(19) NOT NULL DEFAULT '' COMMENT '创建时间',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='登录信息表';

CREATE TABLE `user_info` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键ID',
  `name` varchar(64) NOT NULL COMMENT '登录账号',
  `age` int NOT NULL COMMENT '登录密码',
  `login_id` bigint(20) NOT NULL COMMENT '关联登录表ID',
  `create_time` varchar(19) NOT NULL DEFAULT '' COMMENT '创建时间',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='登录信息表';

启动MyCat Server，连接MyCat（于正常连接MySQL数据库的方法一样），插入测试数据：

INSERT INTO `login_info` (`id`, `account`, `password`, `create_time`) VALUES(10, 'admin01', '123456', NOW());
INSERT INTO `user_info` ( `name`, `age`, `login_id`, `create_time`) VALUES('user01', 20, 10, NOW());

INSERT INTO `login_info` (`id`, `account`, `password`, `create_time`) VALUES(1001, 'admin02', '123456', NOW());
INSERT INTO `user_info` ( `name`, `age`, `login_id`, `create_time`) VALUES('user02', 20, 1001, NOW());

INSERT INTO `login_info` (`id`, `account`, `password`, `create_time`) VALUES(2001, 'admin02', '123456', NOW());
INSERT INTO `user_info` ( `name`, `age`, `login_id`, `create_time`) VALUES('user02', 20, 2001, NOW());

测试结果：

ID为10的login数据进入test01数据库，user_info属于login_info的子表，也进入相对应的数据库。

ID为1001的数据，进入test02数据库，ID为2001进入test03数据库。

至此，利用MyCat实现分库配置。

转载于:https://my.oschina.net/u/925119/blog/1796121

chq0910

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分库分表：MyCat+MySQL实现数据库分片

一、MyCat相关 Mycat的架构其实很好理解，Mycat是代理，Mycat后面就是物理数据库。和Web服务器的Nginx类似。对于使用者来说，访问的都是Mycat，不会接触到后端的数据库。 Mycat官网：http://www.mycat.io/ Mycat...
复制链接

扫一扫