ER表:Entity-Relationship 实体关系
子表的记录与所关 联的父表记录存放在同一个数据分片上,即子表依赖于父表,通过表分组(Table Group)保证数据 Join 不会跨 库操作.表分组(Table Group)是解决跨分片数据 join 的一种很好的思路,也是数据切分规划的重要一条规则
全局表:一个真实的业务系统中,往往存在大量的类似字典表的表,这些表基本上很少变动
字典表具有以下几个特性:
• 变动不频繁
• 数据量总体变化不大
• 数据规模不大,很少有超过数十万条记录。
对于这类的表,在分片的情况下,当业务表因为规模而进行分片以后,业务表与这些附属的字典表之间的关联,就成了比较棘手的问题,所以 Mycat 中通过数据冗余来解决这类表的 join,即所有的分片都有一份数据的拷 贝,所有将字典表或者符合字典表特性的一些表定义为全局表.
数据冗余是解决跨分片数据 join 的一种很好的思路,也是数据切分规划的另外一条重要规则
分片节点(dataNode):
节点主机(dataHost):
数据切分后,每个分片节点(dataNode)不一定都会独占一台机器,同一机器上面可以有多个分片数据库,这样一个或多个分片节点(dataNode)所在的机器就是节点主机(dataHost),为了规避单节点主机并发数限 制,尽量将读写压力高的分片节点(dataNode)均衡的放在不同的节点主机(dataHost)
全局序列号:
多租户: RDS,阿里云服务器等
多租户在数据存储上存在三中方案:
1.独立数据库:即一个用户一个数据库,用户数据隔离级别最高,安全性最好,成本也高
-优点:有助于简化数据模型的扩展设计,满足不同租户的不同需求,如果出现故障,恢复数据比较简单
-缺点:增大了数据库的安装数量,增加了维护成本和购置成本
适合:银行,医院等非常高数据隔离级别的租户,提高租用定价
2.共享数据库,隔离数据架构:多个或所有租户共享 Database,但是每个租户一个 Schema
-优点:为安全性要求高的租户提供了一定程度的逻辑数据隔离,并不是完全隔离,每个数据库可以支持更多的租户数量.
-缺点:如果出现故障,数据恢复比较困难,因为恢复数据库将牵扯到其他租户的数据
如果需要跨租户统计数据,存在一定困难
3.共享数据库,共享数据架构:即租户共享同一个DataBase,同一个Schema,但在表中通过TenantID区分租户的数据,这事共享程度最高,隔离级别最低的模式.
-优点:维护和购置成本最低,允许每个数据库支持的租户数量最多,
-缺点:隔离级别最低,安全性最低,需要在设计开发时加大对安全的开发量
数据备份和恢复最困难,需要逐表逐条备份和还原