shard的核心是通过表中某个字段的特定规则把数据分散到多个数据库节点上,可以减少索引的大小,并可以充分利用其它的硬件。
这个想法和实现在当时也是非常超前的。
在定义sharding的时候,必须要有如下两个条件:
- 有ER服务器,至少2个;
- 在ER中必须要有一个表用于shard,表中必须要有一个专门的列用于跟踪相关的行
基于hash的shard:
cdr define shardCollection collection_1 db_1:john.customers
--type=delete --key=state --strategy=hash --versionCol=version
g_shard_server_A g_shard_server_B g_shard_server_C g_shard_server_D
基于表达式的 shard:
cdr define shardCollection collection_2 db_2:joe.clients
--type=delete --key=region --strategy=expression –-versionCol=version
g_shard_server_A "North"
g_shard_server_B "South"
g_shard_server_C "East"
g_shard_server_D REMAINDER
数据进来的时候先通过shard对数据做切片,然后再通过grid对数据做查询,这些非常优秀的灵魂和设计思路。当前流行的mycat的分库分表也不过如此罢了。