配置 schema.xml
在同一个 mysql 数据库中,创建三个数据库 testdb1、testdb2、testdb3,并在每个库中都创建 user 表。
配置 server.xml
配置 schema.xml
常用分片规则
一、枚举法
partition-hash-int.txt 配置
10000=0
10010=1
上面columns 标识将要分片的表字段,algorithm 分片函数,其中分片函数配置中,mapFile标识配置文件名称,type默认值为0,0表示Integer,非零表示String,所有的节点配置都是从0开始,及0代表节点1
/*** defaultNode 默认节点:小于0表示不设置默认节点,大于等于0表示设置默认节点,结点为指定的值*
默认节点的作用
枚举分片时,如果碰到不识别的枚举值,就让它路由到默认节点* ,如果不配置默认节点(defaultNode值小于0表示不配置默认节点),碰到*不识别的枚举值就会报错,*like this:can't find datanode for sharding column:column_name val:ffffffff */
二、固定分片hash
配置说明
上面columns 标识将要分片的表字段,algorithm 分片函数,partitionCount 分片个数列表,partitionLength 分片范围列表。java培训
分区长度:默认为最大2^n=1024 ,即最大支持1024分区
约束:count,length两个数组的长度必须是一致的。
1024 = sum((count[i]*length[i])). count和length两个向量的点积恒等于1024
用法举例
三、范围约定
配置说明
上面columns 标识将要分片的表字段,algorithm 分片函数,rang-long 函数中mapFile代表配置文件路径
所有的节点配置都是从0开始,及0代表节点1,此配置非常简单,即预先制定可能的id范围到某个分片
四、求模法
配置说明
上面columns 标识将要分片的表字段,algorithm 分片函数,此种配置非常明确即根据id与count(你的结点数)进行求模预算,相比方式1,此种在批量插入时需要切换数据源,id不连续
五、日期列分区法
配置说明
上面columns 标识将要分片的表字段,algorithm 分片函数,配置中配置了开始日期,分区天数,即默认从开始日期算起,分隔10天一个分区,还有一切特性请看源码
六、通配取模
配置说明
上面columns 标识将要分片的表字段,algorithm 分片函数,patternValue 即求模基数,defaoultNode 默认节点,如果不配置了默认,则默认是0即第一个结点mapFile 配置文件路径。配置文件中,1-32 即代表id%256后分布的范围,如果在1-32则在分区1,其他类推,如果id非数字数据,则会分配在defaoultNode 默认节点。
七、ASCII码求模通配
配置说明
上面columns 标识将要分片的表字段,algorithm 分片函数,patternValue 即求模基数,prefixLength ASCII 截取的位数mapFile 配置文件路径。配置文件中,1-32 即代表id%256后分布的范围,如果在1-32则在分区1,其他类推。此种方式类似方式6只不过采取的是将列种获取前prefixLength位列所有ASCII码的和进行求模sum%patternValue ,获取的值,在通配范围内的即分片数。
八、编程指定
配置说明
上面columns 标识将要分片的表字段,algorithm 分片函数。此方法为直接根据字符子串(必须是数字)计算分区号(由应用传递参数,显式指定分区号)。例如id=05-100000002在此配置中代表根据id中从startIndex=0,开始,截取siz=2位数字即05,05就是获取的分区,如果没传默认分配到defaultPartition。
九、字符串拆分hash解析
配置说明
上面columns 标识将要分片的表字段,algorithm 分片函数函数中length代表字符串hash求模基数,count分区数,hashSlice hash预算位,即根据子字符串 hash运算。
十、一致性hash
一致性hash预算有效解决了分布式数据的扩容问题,前1-9中id规则都多少存在数据扩容难题,而10规则解决了数据扩容难点。