Mycat核心配置之schema.xml

 schema.xml 作为 Mycat 中重要的配置文件之一,管理着 Mycat 的逻辑库、表、分片规则、DataNode 以及 DataSource。弄懂这些配置,是正确使用 Mycat 的前提。

一、<schema> 标签

 schema 标签用于定义 Mycat 实例中的逻辑库。Mycat 可以有多个逻辑库,每个逻辑库都有自己的相关配置。可以使用 <schema> 来划分这些不同的逻辑库,在源码的映射类为 io.mycat.config.model.SchemaConfig 类。

<schema name="TESTDB"></schema>

 schema 标签的相关属性:

属性名值类型必需默认值说明
namestring逻辑库名称
checkSQLschemabooleanfalse是否去掉 sql 中的默认逻辑库名
sqlMaxLimitint-1sql 的返回结果集的最大行数
dataNodestring用于绑定逻辑库到某个具体的 database 上
randomDataNodestring

 各属性的具体说明:

  • checkSQLschema 属性
     当该值设置为 true 时,如果我们的执行语句是 select * from TESTDB.travel_record,则 Mycat 会把语句写改为 select * from travel_record,即表示把 schema 名称的字符去掉,避免发送到后端数据执行时报如下异常。

      ERROR 1146 (42S02): Table 'testdb.travelrecord' doesn't exist
    

    不过,即使设置该值为 true,如果语句所带的并非是 schema 指定的名称,例如:select * from db1.travel_record,那么 Mycat并不会删除 db1 这个字段,如果没有定义该库的话则会报错,所以,在提供 SQL 语句时,最好是不带 schema 名称。

  • sqlMaxLimit 属性
     当该值为自然数,且被执行的 SQL 语句中不含 limit 关键字时,Mycat 会自动加上所对应的值,例如此属性的值是 100,则执行 select * from travel_record 的返回结果与执行 select * from travel_record limit 100 返回结果相同。

    如果不设置该值,Mycat 默认会把查询到的信息全部都展示出来,造成过多的输出。所以,在正常使用中,还是建议加上一个值,用于减少过多的数据返回。

     当然,SQL 语句中也可以显式的指定 limit 的大小,不受该属性的约束。

    注意:如果运行的 schema 为非拆分库,那么该属性不会生效。需要手动添加 limit 语句。

  • dataNode 属性
     表示与该逻辑库默认绑定的数据节点(数据库实例——database)。所有没有通过 <table> 标签绑定到其他数据节点的表都会走该数据节点。

    这里注意没有配置在分片里面的表无法显示在查看工具里,但是可以正常使用。

<table> 标签

 <Table> 定义了 Mycat 中的逻辑表,所有需要拆分的表都需要在这个标签中定义。如下代码块所示,同一个 schema 标签内可定义个多个逻辑表,但逻辑表的名称必须唯一,在源码的映射类为 io.mycat.config.model.TableConfig 类。

<schema name="TESTDB">
    <table name="travel_record" dataNode="dn1,dn2,dn3" rule="auto-sharding-long"></table>
    <table name="multipleDn1" dataNode="dn1,dn2,dn3" rule="auto-sharding-long"></table>
</schema>

 table 标签的相关属性:

属性名称值类型必需默认值说明
namestring逻辑表名称
nameSuffixstring逻辑表名前缀(1.6 版本新特性)
dataNodestring本逻辑表分布在哪些 dataNode 上
rulestring分片规则名称
ruleRequiredbooleanfalse是否绑定有分片规则
primaryKeystringnull主键,用于之后路由分析,以及启用自增长主键
typestringnull是否为global
autoIncrementbooleanfalse是否主键自增
subTablesstring
needAddLimitbooleantrue是否需要加返回结果集限制
  • name 属性
     逻辑表的名称,这个名称就如同在数据库中执行create table命令指定的名称一样,同一个 schema 标签中定义的逻辑表名称必须唯一。
  • dataNode 属性
     定义这个逻辑表所属的 dataNode,该属性的值需要和 <dataNode> 中 name 属性的值相对应。如果需要定义的数据节点过多,可以使用如下的方法减少配置:
    <table name="travel_record" dataNode="multipleDn$0-99,multipleDn2$100-199" rule="auto-sharding-long"></table>
    <dataNode name="multipleDn$0-99" dataHost="localhost1" database="db$0-99"></dataNode>
    <dataNode name="multipleDn2$100-199" dataHost="localhost1" database=" db$100-199"></dataNode>
    
     这里需要注意的是 database 属性所指定的真实 database name 需要在后面添加一个$符号,例如上面的例子中,表示需要在真实的 mysql 上建立名称为 db0 到 db199 的 database。
  • rule 属性
     该属性用于指定逻辑表要使用的分片规则名字,规则名字在 rule.xml 中定义,必须与 <tableRule> 中 name 属性值对应。
  • ruleRequired 属性
     该属性用于指定表是否绑定分片规则,如果配置为 true,但没有配置具体 rule 的话,程序会报错。
  • primaryKey 属性
     逻辑表对应真实表的主键。例如:分片的规则是使用非主键进行分片的,那么在使用主键查询的时候,就会发送查询语句到所有配置的数据节点上。如果使用该属性配置真实表的主键,那么 Mycat 会缓存主键与具体的数据节点信息,再次使用非主键进行查询时,就不会进行广播式的查询,就只会接发送语句给具体的数据节点,但是尽管配置该属性,如果缓存并没有命中的话,还是会发送语句给具体的数据节点,来获取数据。
  • type 属性
     该属性定义了逻辑表的类型,目前逻辑表只有“全局表”和“普通表”两种类型。对应的配置:
    • 全局表:global。
    • 普通表:非 global 即可。
  • autoIncrement 属性
     是否自增长主键。MySQL 对非自增长主键,使用 last_insert_id() 是不会返回结果的,只会返回 0。所以,只有定义了自增长主键的表才可以用 last_insert_id() 返回主键值。
     Mycat 目前提供了增长主键功能,但是如果对应的 MySQL 节点上数据表,没有定义 auto_increment,那么在 Mycat 层调用 last_insert_id() 也是不会返回结果的。
     由于 insert 操作的时候没有带入分片键,Mycat 会先取下这个表对应的全局序列,然后赋值给分片键。这样才能正常的插入到数据库中,最后使用 last_insert_id() 才会返回插入的分片键值。
     如果要使用这个功能最好配合使用数据库模式的全局序列。
     使用 autoIncrement=“true” 指定这个表有使用自增长主键,这样 Mycat 才会不抛出分片键找不到的异常。
     使用 autoIncrement=“false” 来禁用这个功能,当然你也可以直接删除掉这个属性。默认就是禁用的。
  • subTables 属性
     目前 1.6 版本开始支持分表,并且 dataNode 在分表条件下只能配置一个,分表条件下不支持各种条件的 join 语句。使用方式是添加 subTables=“t_order$1-2,t_order3”
  • needAddLimit 属性
     指定表是否需要自动的在每个语句后面加上 limit 限制。由于使用了分库分表,数据量有时会特别巨大,这时候执行查询语句,如果恰巧又忘记了加上数量限制的话,那么将查询出所有的数据出来。所以,Mycat 就自动的为我们加上 LIMIT 100。当然,如果语句中有 limit,就不会再次添加了。

<childTable> 标签

 <childTable> 用于定义 E-R 分片的子表。通过标签上的属性与父表进行关联。

<schema name="TESTDB">
    <table name="travel_record" dataNode="dn$1-3">
        <childTable name="company" joinKey="id" parentKey="parent_id"/>
    </table>
</schema>

 <childTable> 的相关属性:

属性名值类型必需默认值说明
namestring子表的表名
joinKeystring插入子表的时候会使用这个列的值查找父表存储的数据节点
parentKeystring与父表建立关联关系的列名
primaryKeystring该表对应的真实主键
needAddLimitboolean是否需要为 sql 自动添加 limit 关键字
autoIncrementbooleanfalse是否主键自增
  • parentKey 属性
     属性指定的值一般为与父表建立关联关系的列名称,程序首先获取 joinKey 的值,再通过 parentKey 属性指定的列名产生查询语句,通过执行该语句得到父表存储在哪个分片上,从而确定子表存储的位置。

二、<dataNode> 标签

 <dataNode>定义了 Mycat 中的数据节点,也就是我们通常所说的数据分片。一个 <dataNode> 就是一个独立的数据分片,在源码的映射类为 io.mycat.config.model.DataNodeConfig 类。

<dataNode name="dn1" dataHost="localhost1" database="db1"/>

将名为 localhost1 节点上数据库实例为 db1 的物理库标记成名为 dn1 的独立数据分片。

 <dataNode> 的相关属性:

属性名值类型必需说明
namestring数据节点名称,须保证唯一
dataHoststring该分片节点所属的节点主机
databasestring真实的 database 名称

 属性释义:

  • name 属性
     定义数据节点的名字(须保证唯一),我们需要在 <table> 上引用这个名称,来建立表与分片对应的关系。
  • dataHost 属性
     该属性用于定义该分片属于哪个数据库实例,属性值是引用自 <dataHost> 上定义的 name 属性。
  • database 属性
     该属性用于定义该分片属于哪个具体数据库实例上的具体库。

    因为这里是用两个维度来定义分片,就是:实例 + 具体的库。因为每个库上建立的表和表结构是一样的,所以这样做就可以轻松的对表进行水平拆分。

三、<dataHost> 标签

 作为 schema.xml 中最后的一个标签,该标签在 Mycat 逻辑库中也是作为最底层的标签存在,直接定义了具体的数据库实例、读写分离配置和心跳语句,在源码的映射类是 io.mycat.config.model.DataHostConfig 类。

<dataHost name="dn1" balance="0" dbDriver="native" dbType="mysql" maxCon="10" minCon="100">
    <heartbeat>select 1 from dual</heartbeat>
    <writeHost host="hostM1" url="master1:3306" user="root" password="123456">
        <readHost host="hostS1" url="slave1:3306" user="root" password="123456"/>
    </writeHost>
</dataHost>

<dataHost> 标签的相关属性:

属性名值类型必需默认值说明
namestring节点主机的唯一标识,供其他标签使用
maxConint128读写连接池的最大连接数
minConint10读写连接池的最小/初始连接数
balanceint0负载均衡类型
balanceTypeint0负载均衡策略
dbTypestring后端数据库类型
dbDriverstring连接后端数据库使用的驱动
writeTypeint0写类型
switchTypeint-1切换类型
slaveThresholdint-1从库延迟界限
tempReadHostAvailableint0写节点宕机时,临时读节点是否可用
notSwitchstring0

 属性释义:

  • balance 属性
     负载均衡类型,目前的取值有 4 中:
    • balance=“0”,不开启读写分离机制,所有读操作都发送到当前可用的 writeHost 上。
    • balance=“1”,全部的 readHost 与 stand by writeHost 参与 select 语句的负载均衡,简单地说,当说双主从模式(M1 -> S1,M2 -> S2,并且 M1 与 M2 互为主备),正常情况下,M2、S1、S2 都参与 select 语句的负载均衡。
    • balance=“2”,所有读操作都随机的在 writeHost、readHost 上分发。
    • balance=“3”,(1.4+ 版本特性)所有读请求随机的分发到 writeHost 对应的 readHost 执行,writeHost 不负担读压力。
  • balanceType 属性
    • 0 表示随机。
    • 1 表示加权轮询。
    • 2 表示最少活跃数。
  • writeType 属性
     负载均衡类型,目前的取值有 2 种:
    • writeType=“0”,所有写操作发送到配置的第一个 writeHost,第一个挂了切到还存活的第二个 writeHost,重新启动后以切换后的为准,切换信息记录在 dnindex.properties 配置文件。
    • writeType=“1”,所有写操作都随机的发送到配置的 writeHost。(1.5+ 废弃,不推荐使用)
  • switchType 属性
    • -1 表示不自动切换。
    • 1 自动切换。
    • 2 基于 MySQL 主从同步的状态决定是否切换。心跳语句为:show slave status
    • 3 基于 MySQL galary cluster 的切换机制(适合集群)(1.4.1+版本)。心跳语句为:show status like ‘wsrep%’
  • dbType 属性
     指定后端连接的数据库类型,目前支持二进制的 mysql 协议,还有其他使用 JDBC 连接的数据库。例如:mongodb、oracle、spark 等。
  • dbDriver 属性
     指定连接后端数据库使用的驱动,目前可选的值有 native 和 JDBC。使用 native 的话,因为这个值执行的是二进制的 mysql 协议,所以可以使用 mysql 和 maridb。其他类型的数据库则需要使用 JDBC 驱动来支持。从 1.6 版本开始支持 postgresql 的 native 原始协议。
     如果使用 JDBC 的话,需要将符合 JDBC 4 标准的驱动 JAR 包放到 MYCAT\lib 目录下,并检查驱动 JAR 包中包括如下目录结构的文件:META-INF\services\java.sql.Driver。在这个文件内写上具体的 Driver 类名,例如:com.mysql.jdbc.Driver。
  • tempReadHostAvailable 属性
     如果属性值大于 0 则表示在写节点宕机时,临时的读服务依然可用,即如果配置了这个属性,<writeHost> 下面的 <readHost> 仍旧可用,默认 0 可配置(0、1)。

<heartbeat> 标签

 这个标签内指明用于和后端数据库进行心跳检查的语句。例如,MySQL 可以使用 select user(),Oracle 可以使用 select 1 from dual 等。

<dataHost name="dn1" balance="0" dbDriver="native" dbType="mysql" maxCon="10" minCon="100">
    <heartbeat>select user()</heartbeat>
</dataHost>

Mycat 1.4 版本的主从切换的心跳语句必须是:show slave status

<connectionInitSql> 标签

 当使用 Oracle 数据库时,需要执行的初始化 SQL 语句就放到这里面来。例如:

<dataHost name="dn1" balance="0" dbDriver="jdbc" dbType="oracle" maxCon="10" minCon="100">
    <heartbeat>select 1 from dual</heartbeat>
    <connectionInitSql>alter session set nls_date_format='yyyy-mm-dd hh24:mi:ss'</connectionInitSql>
</dataHost>

<writeHost> 标签、<readHost> 标签

 这两个标签都是指定后端数据库的相关配置给 Mycat,用于实例化后端连接池。唯一不同的是:<writeHost> 指定写实例、<readHost> 指定读实例,组合这些读写实例来满足系统的要求。

<dataHost name="dn1" balance="0" dbDriver="native" dbType="mysql" maxCon="10" minCon="100">
    <writeHost host="hostM1" url="master1:3306" user="root" password="123456">
        <readHost host="hostS1" url="slave1:3306" user="root" password="123456"/>
    </writeHost>
</dataHost>

 在一个 <dataHost> 内可以定义多个 <writeHost> 和 <readHost>。但是,如果 <writeHost> 指定的后端数据库宕机,那么这个 <writeHost> 绑定的所有 <readHost> 都将不可用。另一方面,由于这个 <writeHost> 宕机系统会自动的检测到,并切换到备用的 <writeHost> 上去。
 <writeHost> 和 <readHost> 的属性相同,这里就一起介绍。

属性名值类型必需默认值说明
hoststring用于标识不同实例,一般writeHost使用 M1;readHost 用 S1
urlstring后端实例连接地址,如果是使用 native 的 dbDriver,则一般为 localhost:3306 形式;
在使用 jdbc 时,则可写为:jdbc:mysql://localhost:3306
userstring后端存储实例需要的用户名称
passwordstring后端存储实例需要的密码
weightstring0权重。配置在 <readhost> 中作为读节点的权重(1.4+ 版本生效)
usingDecryptstring0是否对密码加密
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值