mycat是什么鬼？垂直切分？水平切分？

最新推荐文章于 2024-08-23 15:33:46 发布

node2017

最新推荐文章于 2024-08-23 15:33:46 发布

阅读量1w

点赞数 8

分类专栏： java开发文章标签： mycat 垂直切分水平切分

本文链接：https://blog.csdn.net/yingxiake/article/details/51695094

版权

java开发专栏收录该内容

44 篇文章 1 订阅

订阅专栏

mycat是什么鬼

mycat是国人开发的一款开源的数据库中间件，他的作用就是伪装成一个真的数据库，然后在它背后，连的是多种类型，集群分布式的真实数据库。他的体系结构就像下面：

这里写图片描述

需要理解mycat的几个概念。

schema:逻辑库，与MySQL中的Database（数据库）对应，一个逻辑库中定义了所包括的Table。
table：表，即物理数据库中存储的某一张表，与传统数据库不同，这里的表格需要声明其所存储的逻辑数据节点DataNode，这是通过表格的分片规则定义来实现的，table可以定义其所属的“子表(childTable)”，子表的分片依赖于与“父表”的具体分片地址，简单的说，就是属于父表里某一条记录A的子表的所有记录都与A存储在同一个分片上。
分片规则：是一个字段与函数的捆绑定义，根据这个字段的取值来返回所在存储的分片（DataNode）的序号，每个表格可以定义一个分片规则，分片规则可以灵活扩展，默认提供了基于数字的分片规则，字符串的分片规则等。
dataNode: MyCAT的逻辑数据节点，是存放table的具体物理节点，也称之为分片节点，通过DataSource来关联到后端某个具体数据库上，一般来说，为了高可用性，每个DataNode都设置两个DataSource，一主一从，当主节点宕机，系统自动切换到从节点。
dataHost：定义某个物理库的访问地址，用于捆绑到dataNode上。

MyCAT目前通过配置文件的方式来定义逻辑库和相关配置：
MYCAT_HOME/conf/schema.xml中定义逻辑库，表、分片节点等内容；
MYCAT_HOME/conf/rule.xml中定义分片规则；
MYCAT_HOME/conf/server.xml中定义用户以及系统相关变量，如端口等。

说了那么多，或许你看看下面的图就明白了：

这里写图片描述

mycat的好处就是你可以使用他就像使用真的mysq数据库一样，jdbc该怎么连，命令行该怎么敲就怎么敲，sql语句该怎么写就怎么写，它的出现让你的业务代码持久层不用动，而背后，却能帮搭建起mysql的分表，分库，读写分离，集群分布式。

下面就简单使用mycat来帮助我们将业务数据表进行垂直切分和水平切分

垂直切分搭建

垂直切分其实就是根据业务的不同，将不同业务的表放到不同的数据库中，例如我们订单表，用户表，用户评论表，因为他们业务的不同，可以将他们分别放到三个数据库中。好，那我们就使用三个数据库，分别安装三张表，使用mysql架构如下：

这里写图片描述

1、修改MYCAT_HOME/conf/schema.xml，内容如下：

<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://org.opencloudb/">

    <!-- schema逻辑数据库 -->
    <schema name="mycat1" checkSQLschema="false" sqlMaxLimit="100" dataNode="mycat1" />
    <schema name="mycat2" checkSQLschema="false" sqlMaxLimit="100" dataNode="mycat2" />
    <schema name="mycat3" checkSQLschema="false" sqlMaxLimit="100" dataNode="mycat3" />

    <!--使用dataNode将实际数据库和逻辑数据库映射-->
    <dataNode name="mycat1" dataHost="mycat" database="mycat1" />
    <dataNode name="mycat2" dataHost="mycat" database="mycat2" />
    <dataNode name="mycat3" dataHost="mycat" database="mycat3" />

    <dataHost name="mycat" maxCon="1000" minCon="10" balance="0"
       writeType="0" dbType="mysql" dbDriver="native">
       <heartbeat>select user()</heartbeat>
       <!--写上数据库链接信息-->
       <writeHost host="hostM1" url="192.168.137.101:3306" user="root" password="123" />
       <writeHost host="hostM2" url="192.168.137.102:3306" user="root" password="123" />
       <writeHost host="hostM3" url="192.168.137.103:3306" user="root" password="123" />
    </dataHost>
</mycat:schema>

2、修改MYCAT_HOME/conf/server.xml,添加链接mycat的帐号信息等

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://org.opencloudb/">
    <system>
    <property name="defaultSqlParser">druidparser</property>
    </system>
    <!--帐号密码以及所链接的逻辑库-->
    <user name="test">
        <property name="password">test</property>
        <property name="schemas">mycat1,mycat2,mycat3</property>
    </user>

    <!--只读的用户信息-->
    <user name="user">
        <property name="password">user</property>
        <property name="schemas">mycat1,mycat2,mycat3</property>
        <property name="readOnly">true</property>
    </user>
</mycat:server>

3、那么你可以用mysql的客户端，或者直接命令行的方式进入mysql客户端，查看数据库。

这里写图片描述

可以看到mycat把三个数据库的内容都包含进来了，完成的垂直切分。

数据库水平切分

除了可以按照业务将数据表分配到不同的的数据库中做成垂直切分，很多时候，用户量大的时候，例如一张用户表有上亿条数据，那么一次性查数据肯定很慢，那么我们可以这样子，将这张表按照某种规则将数据存放到不同的数据库中，例如可以按照用户省份的不同，将数据切分到广东省，北京市，上海市等数据库中。下面假如我们有一张student表，因为数据量太多，就按照id的取余规则，将数据分别存放到俩个数据库中，架构如下：

这里写图片描述

下面这么配置：

1、修改MYCAT_HOME/conf/schema.xml，内容如下：

<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://org.opencloudb/">

    <!-- tb_class和tb_student有外键关联关系，可以测试join -->
    <schema name="test" checkSQLschema="false" sqlMaxLimit="100">
       <table name="tb_class" dataNode="dn1,dn2" rule="rule1" primaryKey="id"/>
       <table name="tb_student" dataNode="dn1,dn2" rule="rule1" primaryKey="id"/>
    </schema>

    <dataNode name="dn1" dataHost="mycat101" database="mycat101" />
    <dataNode name="dn2" dataHost="mycat103" database="mycat103" />

    <dataHost name="mycat101" maxCon="1000" minCon="10" balance="0"
       writeType="0" dbType="mysql" dbDriver="native">
       <heartbeat>select user()</heartbeat>
       <writeHost host="host1" url="192.168.137.101:3306" user="root" password="123" />
    </dataHost>

    <dataHost name="mycat103" maxCon="1000" minCon="10" balance="0"
       writeType="0" dbType="mysql" dbDriver="native">
       <heartbeat>select user()</heartbeat>
       <writeHost host="host3" url="192.168.137.103:3306" user="root" password="123" />
    </dataHost>
</mycat:schema>

2、修改MYCAT_HOME/conf/server.xml,添加链接mycat的帐号信息等

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://org.opencloudb/">
    <system>
    <property name="defaultSqlParser">druidparser</property>
    </system>
    <!--帐号密码以及所链接的逻辑库-->
    <user name="test">
        <property name="password">test</property>
        <property name="schemas">test</property>
    </user>

    <!--只读的用户信息-->
    <user name="user">
        <property name="password">user</property>
        <property name="schemas">test</property>
        <property name="readOnly">true</property>
    </user>
</mycat:server>

3、定义切片规则，修改MYCAT_HOME/conf/rule.xml，这里是安装id进行切片

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
<mycat:rule xmlns:mycat="http://org.opencloudb/"> 
 <tableRule name="rule1">
    <!--安装id规则，将id除于1024然后取余，如果余数落在0~512就将数据写到第一个数据库，如果是在512~1024就放到第二个数据库-->
    <rule>
      <columns>id</columns>
      <algorithm>func1</algorithm>
    </rule>
 </tableRule>

 <!--分成俩片，每片的区间是512，必须要俩个相乘是1024-->
 <function name="func1" class="org.opencloudb.route.function.PartitionByLong">
    <property name="partitionCount">2</property>
    <property name="partitionLength">512</property>
 </function>
</mycat:rule>