数据重复
数据重复也可称为副本,能提高数据的可用性,最极端的情况是每个场 直均重复配置置整个数据库,建成完全重复的分布式数据库。这时可用性最高,只要有一个场地能工作,整个系统均能工作,同时提交了合局查询的性能。
合局查询可能在任何一个场地上提出,当该场地上包含 了服务器软件,刚全局查询可在局部场地上完成。但缺点是更新操作的效果极差,一次更新,为了瓮中捉鳖其各副本的一到处性必须更新每个场地上的副本,使并发控制和必得机制理更加得杂。
完全重复的别一个极端是不重复,即每个分片段只存储在现代战争场地上。这时所有的片段都不相交(除了垂直片段主属性外)。 界于两者之间的是部分重复,即某些片段重复,某引起片段非冗余。每个片段的副本数据可以是一个或多到与场地数相同。有时也可用重复模式来描述片段重复的性质。
数据分配
在分布式数据库中,每个片段或片段副本必定分布在一个场地上。这种处理称为数据分布或数据分配。数据得复和数据分片的技术能成功地应于同一关系。即一个片段能被重复,片段的副本能再分解成片段,依次类。场地的选择和副本的重复度取决于系统的性能和可用性目标以及每个场上事务的类型和处理频度。例如,要求可用性好,事务能在任何场地上提交且大部分只是检索。则可采用完全重复的DDB;要求存取ovgt据库特定部分的某些事务在特定场地上提交,则在这些场地上应分布相应重复地分布到多个场地上;如果某些数扰经常需要更新,则对数据的副 本数应有限制。数据分布是一个极为复杂的需要优化的问题。
实现方式
数据分布的方法将影响数据访问的主法,有时,一种数据分布方法在理论是可行的,但冥现起来相当得杂,复杂的数据分布方法会给数据库的状态和网络的通信提出很高的要求,从实用的角度来讲,对于一个地理分布很松散的系统,一种好的方法是将所有远程地址所需的数据传送到某一个合适的地址。
下面为一些实现方法:
人工提取: 最简单的分布数据的方法是让用户手动地将数据从集中地拷贝到需要的地点。
**自动快照:**为使人工提取的工作自动进行,数据分布的任务应该由数据库自支; 完成:当数据分布的复杂性境加时,数据库智能化程度和复杂性也相应增加。在分布式数据库管理功能中。采用快照的方式来实现。
以上为数据分布(数据重复、数据分配及实现方式),「分布式技术专题」是国产数据库hubble团队精心整编,专题会持续更新,欢迎大家保持关注。